Python pandasでCSVをキーワード検索して行を抽出する方法

Pythonのpandasライブラリを使って、CSVファイルから特定のキーワードを検索して行を抽出することができます。この記事では、pandasを使ったCSVのキーワード検索の方法を説明します。また、Pythonのコード例も紹介します。

pandasのインストール

pandasを使用する前に、まずpandasをインストールする必要があります。ターミナルで以下のコマンドを実行してください。

pip install pandas

CSVファイルの読み込み

pandasを使用してCSVファイルを読み込むには、read_csv関数を使用します。以下のコードは、example.csvという名前のCSVファイルを読み込む例です。

import pandas as pd

df = pd.read_csv('example.csv')

キーワード検索

dfには、読み込んだCSVファイルのデータが含まれています。キーワード検索を行うには、str.contains()メソッドを使用します。以下のコードは、example.csvファイルのName列でAppleというキーワードを検索する例です。

df_apple = df[df['Name'].str.contains('Apple')]

上記のコードでは、df['Name'].str.contains('Apple')がTrueの行のみを抽出しています。df_appleには、Name列がAppleを含む行のデータが含まれます。

抽出したデータをCSVファイルとして保存

最後に、抽出したデータをCSVファイルとして保存するには、to_csvメソッドを使用します。以下のコードは、df_appleapple.csvという名前のファイルとして保存する例です。

df_apple.to_csv('apple.csv', index=False)

上記のコードでは、index=Falseを指定しています。これは、CSVファイルに行番号を含めないようにするためのオプションです。

以上が、Pythonのpandasを使用したCSVのキーワード検索の方法です。キーワードを変えることで、他の列や複数のキーワードでの検索も可能です。これらのプログラムはPythonの基本的な文法とライブラリで実装することができます。Pythonの基礎学習には下記のようなサイトの利用が有効です。

click.linksynergy.com

click.linksynergy.com