Registration info |
参加枠 Free
FCFS
参加枠(サポートなし) Free
FCFS
|
---|
Description
ももち浜TECHカフェ「PythonによるWebスクレイピング入門」
ももち浜TECHカフェは福岡市ももち浜から発信する、IoT・AR・VRなどをテーマにしたハンズオン・勉強会企画です。
今回のテーマはWebスクレイピング
※4/15サポートなし枠を増設しました。コーディングにある程度慣れていて、スタッフのサポートが必要ない方はこちらの枠もご活用ください
目的
・データ分析をしたい!でもデータがない!そんなあなたにWebスクレイピング
・今回はPythonのライブラリを使ったデータ収集と、正規表現によるデータ加工、およびExcelによる可視化のハンズオンを行います
・手作業によるデータ収集とデータ加工の苦労が軽減されるきっかけになれば幸いです
参加条件
・何かしらの言語でif文やforループといった基本的なプログラミングを書いたことのある人
・Pythonをインストールして触ったことのある人
・Excelの基本操作を知っている人
想定参加対象者
・手作業でデータ収集やデータ加工をしており苦労されている方
・プログラムを使ったデータ収集や可視化に興味はあるが、まだあまりノウハウの無い方
サポートなし枠
・講師・アシスタントのサポートなしでハンズオンについてこれる方向けです
おそらく参加対象外の方(物足りないとおそらく感じられる方)
・業務でクローリングやスクレイピングを既に実践されている方
・参考の書籍で自力で実装できる方
参考書籍
Pythonクローリング&スクレイピング -データ収集・解析のための実践開発ガイド
https://www.amazon.co.jp/gp/product/4774183679/
今回実施しない内容
・認証やJSを読み込んだWebサイトのクローリング・スクレイピング
・収集データのDBへのデータ格納
・クローラの安定稼働とエラー検知
=> 興味のある方は参考の書籍に記載がありますのでそちらご参照ください
講師
大城 信晃 氏
NOB DATA株式会社 代表取締役
当日の内容
プログラム(仮)
パート | 内容 | 時間内訳 |
---|---|---|
はじめに (10min) | オープニング & 各自、自己紹介タイム | |
part.1 PythonでWebスクレイピング (70min) |
||
導入 : スクレイピングの用語説明やメリット、利用シーン | 10min | |
説明 : Pythonを使ったWebスクレイピング | 30min | |
ハンズオン : 各自好きなHTMLテキストをスクレイピング | 30min | |
休憩 (10min) | ||
part.2 データ加工と保存、可視化 (60min) |
||
説明 : 正規表現入門 | 10min | |
ハンズオン : 正規表現でデータ加工 | 20min | |
説明 : スクレイピングデータをExcelで読み込んで可視化 | 10min | |
ハンズオン : Excelデータを眺める、可視化、ピボットテーブル | 20min | |
休憩 (10min) | ||
時間あれば or ご紹介のみ KHCoderによるテキストマイニング (20min) |
||
5分で使えるKHCoder | 10min | |
フィードバック : 各自、感想や面白い結果あれば共有 | 10min |
(※プログラムの構成は変更の可能性もあります)
会場
福岡システムLSI総合開発センター4階 交流サロン
福岡市早良区百道浜3-8-33(最寄バス停:福岡タワー南口)
博多駅か天神バスセンター前からのバスが便利です。
※会場は変更になる場合があります。その際は、事前にアナウンスします。
懇親会
当日勉強会終了後に懇親会を予定しています。
軽食等ご用意しますのでこちらもぜひ、ご参加ください。
アンケートにて出欠を確認しています。
会費:500円 ※当日回収します。
開始:17時00分から(予定)
機材等
PC:主催者が用意します。
プログラミング知識ほか:for文if文がわかる人
注意事項
当日受付の際に、本人確認のため受付票の提示と名刺の提出をお願いします。
当日名刺を忘れた場合・学生等のため名刺がない場合は、会場にて氏名、ご所属等をお伺いします。
また、いただいた個人情報はももち浜TECHカフェの今後の運営の参考とするために活用し、主催者(ふくおかIST・ISIT・QUEST)でのみ共有します。