Pythonでロイター、ブルームバーグ、YahooのRSSから経済関連のニュース情報を抽出する
経済ニュースを発信しているロイター、ブルームバーグ、YahooニュースのRSSから各記事の情報を取得するスクリプトを紹介します。
ロイターから抽出する
ロイターについてはこちらのページにカテゴリーごとのRSS情報が掲載されています。
経済ニュースとしては、以下のRSSから情報を取得すれば十分だと思います。
実際のコードはこちらです。タイトル、記事リンク、記事テキストを抽出し、print文で表示するようなコードとしています。
各カテゴリーの情報を取得するのにmain関数のurlを使っていますので、ここを書き換えればそれぞれのカテゴリーの記事を抽出できます。
ブルームバーグから抽出する
ブルームバーグについてもこちらのページにカテゴリーごとのRSS情報が掲載されています。
経済ニュースとしては、以下のリンクから抽出で良いでしょう。
コードはロイター抽出スクリプトのextract_content関数を少し変えただけです。
Yahooニュースから抽出する
YahooニュースのRSSはこちらにまとめられています。
経済とITを抽出候補にするのが良さそうです。
カテゴリー | リンク |
---|---|
経済 | https://news.yahoo.co.jp/rss/categories/business.xml |
IT | https://news.yahoo.co.jp/rss/categories/it.xml |
Yahooニュースの場合は、記事が複数ページにまたがることがあるので、extract_content関数にその処理のためのコードを入れています。
以上です。