メディカルドックの「おすすめのクリニック」記事に掲載されているPR医院(広告枠)だけを自動検出・抽出し、Excelなどでそのまま使える高精度なCSVファイルとして出力するChrome拡張機能です。
拡張機能(ZIP)をダウンロードPR対象のみを安全かつ効率的に収集するための先進的設計
従来のID(clinic-2001)による曖昧な判定を廃止。サイトテーマのCSS設計に基づく「puクラス」の有無を精緻に検証することで、PRリボン付きの医院のみを100%正しく抽出します。
一覧ページをどこまで巡回するかをUIから手動設定可能(1〜250ページ)。全データを毎回巡回することなく、最新の数ページだけを短時間で抽出したい場合に最適です。
Chromeのローカルストレージと密に同期。巡回途中でブラウザがスリープしたりエラーが発生しても、進捗状況を保持したままいつでも「再開」ボタンから続きを抽出できます。
3分でセットアップが完了し、すぐにスクレイピングを開始できます
上の「拡張機能(ZIP)をダウンロード」ボタンからZIPパッケージを入手し、ご自身のPC上で解凍します。
Chromeで chrome://extensions/ を開き、右上の「デベロッパー モード」をONにします。左上に現れる「パッケージ化されていない拡張機能を読み込む」から、解凍してできたフォルダを選択して読み込ませます。
拡張機能アイコンをクリックして起動し、必要に応じて「最大巡回一覧ページ数」を設定して「▶ 開始」をクリックします。自動でスクレイピング用タブが立ち上がり、収集を開始します。
巡回が完了(または途中で「停止」)すると、「⬇ CSV」ボタンが有効化されます。クリックするとExcel対応のUTF-8 (BOM付き)形式で文字化けのない綺麗なCSVファイルをダウンロードできます。