Ruby

RubyでRSSを取得する方法

RubyでRSSを取得し、ファイルに出力するためのテンプレート。titleとlinkタグを取得する。スクレイピング用途で情報収集に便利。

Shou Arisaka
1 分で読める
2017年3月15日

概要

rubyでrssを取得し、ファイルに出力するためのテンプレート。 titleとlinkタグを取得する。

スクレイピング用途で情報収集に便利。 なんかの記事であれば、取得したあとで形態素解析してkwを抽出するとか。

テンプレート

require 'rss'

###filename 取得したいRSSのurl
###filenames 任意のファイル名

filename = 'https://yuis-programming.com/feed'        ##取得したいRSSのurl
rss = RSS::Parser.parse(filename)
rss.items.each{|item|
  puts title = item.title
  puts link = item.link
  #puts des = item.description

    filenames = "rss"        ##任意のファイル名
    File.open("C:" + filenames + ".txt", "a") do |f|  #保存先のファイルをエディタなどで開いているとエラー
    #f.puts item.title
    f.puts title
    f.puts link
    #f.puts des
    end

}

エラー対策

C:/Ruby23-x64/lib/ruby/2.3.0/net/http.rb:933:in `connect_nonblock': SSL_connect returned=1 errno=0 state=error: certificate verify failed (OpenSSL::SSL::SSLError)

上記エラーを吐く場合は、urlを"https://" → "http://"とするといける。

※セキュリティ上問題あるかもしれません。信用できるサイトにて自己責任でお使いください。

この記事をシェア

Shou Arisaka 2017年3月15日

🔗 リンクをコピー