Pythonのpandasライブラリを使って、CSVファイルから特定のキーワードを検索して行を抽出することができます。この記事では、pandasを使ったCSVのキーワード検索の方法を説明します。また、Pythonのコード例も紹介します。
pandasのインストール
pandasを使用する前に、まずpandasをインストールする必要があります。ターミナルで以下のコマンドを実行してください。
pip install pandas
CSVファイルの読み込み
pandasを使用してCSVファイルを読み込むには、read_csv
関数を使用します。以下のコードは、example.csv
という名前のCSVファイルを読み込む例です。
import pandas as pd df = pd.read_csv('example.csv')
キーワード検索
df
には、読み込んだCSVファイルのデータが含まれています。キーワード検索を行うには、str.contains()
メソッドを使用します。以下のコードは、example.csv
ファイルのName
列でApple
というキーワードを検索する例です。
df_apple = df[df['Name'].str.contains('Apple')]
上記のコードでは、df['Name'].str.contains('Apple')
がTrueの行のみを抽出しています。df_apple
には、Name
列がApple
を含む行のデータが含まれます。
抽出したデータをCSVファイルとして保存
最後に、抽出したデータをCSVファイルとして保存するには、to_csv
メソッドを使用します。以下のコードは、df_apple
をapple.csv
という名前のファイルとして保存する例です。
df_apple.to_csv('apple.csv', index=False)
上記のコードでは、index=False
を指定しています。これは、CSVファイルに行番号を含めないようにするためのオプションです。
以上が、Pythonのpandasを使用したCSVのキーワード検索の方法です。キーワードを変えることで、他の列や複数のキーワードでの検索も可能です。これらのプログラムはPythonの基本的な文法とライブラリで実装することができます。Pythonの基礎学習には下記のようなサイトの利用が有効です。