Python pandasでCSVをキーワード検索して行を抽出する方法
Pythonのpandasライブラリを使って、CSVファイルから特定のキーワードを検索して行を抽出することができます。この記事では、pandasを使ったCSVのキーワード検索の方法を説明します。また、Pythonのコード例も紹介します。
pandasのインストール
pandasを使用する前に、まずpandasをインストールする必要があります。ターミナルで以下のコマンドを実行してください。
pip install pandas
CSVファイルの読み込み
pandasを使用してCSVファイルを読み込むには、read_csv関数を使用します。以下のコードは、example.csvという名前のCSVファイルを読み込む例です。
import pandas as pd df = pd.read_csv('example.csv')
pandasデータ処理ドリル Pythonによるデータサイエンスの腕試し [ 株式会社ビープラウド ]
キーワード検索と抽出
dfには、読み込んだCSVファイルのデータが含まれています。キーワード検索を行うには、str.contains()メソッドを使用します。以下のコードは、example.csvファイルのName列でAppleというキーワードを検索する例です。
df_apple = df[df['Name'].str.contains('Apple')]
上記のコードでは、df['Name'].str.contains('Apple')がTrueの行のみを抽出しています。df_appleには、Name列がAppleを含む行のデータが含まれます。
抽出したデータをCSVファイルとして保存
最後に、抽出したデータをCSVファイルとして保存するには、to_csvメソッドを使用します。以下のコードは、df_appleをapple.csvという名前のファイルとして保存する例です。
df_apple.to_csv('apple.csv', index=False)
上記のコードでは、index=Falseを指定しています。これは、CSVファイルに行番号を含めないようにするためのオプションです。
まとめ
以上が、Pythonのpandasを使用したCSVのキーワード検索の方法です。キーワードを変えることで、他の列や複数のキーワードでの検索も可能です。これらのプログラムはPythonの基本的な文法とライブラリで実装することができます。最後にPythonやデータ分析の学習に利用できるUdemy
のサイトを紹介します。ぜひ活用ください。
[PR]
関連記事
Pandsについては、下記の記事でも解説しています。便利なチートシートも用意していますので、ぜひ活用して下さい。