TAG

スクレイピング

htmlのスクレイピングで結合されたテーブルは厄介

htmlのスクレピングをしていてテーブルデータを1行ずつ抜き出して使いたいことは多いと思いますが(特に古いタイプのデザインだとテーブルでレイアウトしてある)、セルが結合されていると行毎の要素数が変わるので一筋縄ではいきません。結合されていなければtr要素を抽出して、td要素はtr[0]のようなイメー […]