Python pandasでExcelをキーワード検索して行を抽出する方法

Pythonを使用すると、Excelファイルからキーワードを検索して行を抽出することができます。この記事では、Pythonを使用してExcelファイルからキーワードを検索して行を抽出する方法を説明します。また、具体的なコード例も示します。

Pythonを使ってExcelファイルを操作する方法には、いくつかのライブラリがありますが、代表的なのはpandasopenpyxlです。ここではpandasを利用してキーワードを検索して行を抽出する方法を紹介します。

必要なライブラリのインストール

Pythonを使用してExcelファイルを扱うためには、まず必要なライブラリをインストールする必要があります。以下のコマンドを使用して、今回必要なライブラリ「pandas」をインストールします。

pip install pandas

pydocument.hatenablog.com

Excelファイルの読み込み

まず、Excelファイルを読み込みます。pandasライブラリを使用すると、Excelファイルを簡単に読み込むことができます。

import pandas as pd

# Excelファイルを読み込む
df = pd.read_excel('sample.xlsx')

ここで、sample.xlsxExcelファイルのファイル名です。ファイルパスが必要な場合は、ファイル名の前にファイルパスを追加してください。

キーワードの検索と行の抽出

次に、Excelファイルからキーワードを検索して、該当する行を抽出します。以下のコードを使用して、キーワードを検索して行を抽出することができます。

# キーワードを指定
keyword = 'Python'

# キーワードを含む行を抽出
filtered_df = df[df['列名'].str.contains(keyword)]

ここで、列名Excelファイルの中でキーワードを検索する列の名前を指定します。contains関数は、指定したキーワードを含む行を抽出するために使用されます。

結果の出力

最後に、抽出された行をExcelファイルとして出力することができます。以下のコードを使用して、抽出された行をExcelファイルとして出力することができます。

# 結果をExcelファイルとして出力
filtered_df.to_excel('result.xlsx', index=False)

ここで、result.xlsxは出力するExcelファイルのファイル名です。index=Falseを指定すると、行のインデックスは出力されません。

まとめ

以上で、Pythonを使用してExcelファイルからキーワードを検索して行を抽出する方法を説明しました。これらのプログラムはPythonの基本的な文法とライブラリで実装することができます。Pythonの基礎学習には下記のようなサイトの利用が有効です。

click.linksynergy.com

click.linksynergy.com