Skip to content

ライフハッカーの全文配信化 (filterss.rb)

by wetcradle on 5月 28th, 2011

以前、ITmedia と クラウド Watch の全文配信 RSS を紹介しましたが、ライフハッカーも全文配信したくなったので filterss.rb に設定を追加しました。全文配信は http://temp.wetcradle.com/filterss/lifehacker.rss で行っています。

filterss.rb 追加機能

ただ、ライフハッカーの全文には広告が埋めこまれているため、今までの filterss.rb では広告も配信してしまいます。そこで、filterss.rb のフィルタリング機能に特定要素を取り除く機能を追加しました。以下のような感じでフィルタリングルールを設定すれば OK です。

<rule>
	<block>
		<target>item_title</target>
		<regexp>^AD:</regexp>
	</block>
	<block>
		<target>item_title</target>
		<regexp>^PR:</regexp>
	</block>
	<extract>
		<target>item_page</target>
		<value>.entry_body</value>
	</extract>
	<remove>
		<target>item_page</target>
		<value>.EntryMoreBanner</value>
	</remove>
	<remove>
		<target>item_page</target>
		<value>.recententries</value>
	</remove>
	<remove>
		<target>item_page</target>
		<value>#newzia_connect_iframe</value>
	</remove>
	<remove>
		<target>item_page</target>
		<value>.ad_entry_amazon_under</value>
	</remove>
	<remove>
		<target>item_page</target>
		<value>.facebook_block</value>
	</remove>
	<remove>
		<target>item_page</target>
		<value>.rakuten_widget</value>
	</remove>
	<remove>
		<target>item_page</target>
		<value>.amazon_ranking</value>
	</remove>
</rule>

filterss.rb の配布

恥ずかしいので公開していませんが、要望があればいつでも公開します。

From → RSS, Ruby

No comments yet

Leave a Reply

Note: XHTML is allowed. Your email address will never be published.

Subscribe to this comment feed via RSS