Python

Pythonによるスクレイピング&機械学習(感想)

読書感想、というよりプログラミング学習につまずいた話です(笑)

Pythonは機械学習、深層学習に向いたプログラミング言語として知られています。

独学でどこまでディープラーニングを使ったツールを作れるようになるか?をテーマにちょっとずつ読み進めてみたわけです。

結論から言うと、挫折しました。

実は、最初に読み始めたのは昨年5月で、ソースコードを写経しながら自分のPC上で動かしてみて、スクレイピングが出来ることは確認できていました。

写経で進める形だと、時間がかなりかかってしまうのと、本質が見えにくくなります。

どのライブラリのどういうコマンドを使うと、プログラムが動くのかという点も、演習問題などがなければ復習しようとしなければ身に付きません。

復習すると、時間がかかり過ぎて、前に覚えたところを忘れ始めてしまったり。

完全に悪循環です。

著者と自分のPC環境は異なるわけで、写経しても動かないことも当然散見されます。

本の半ばでソースコードを再現できなくなったところで挫折し、お蔵入りしていました。

半年がたち、プログラミング学習を再開してみようかなと思い立って、やってみたわけです。

まず、本の全体像を見直してみました。

すると、この本を完全に理解したとして、何が出来るようになるかという本質的な部分が見えてきます。

僕の理解では、

  • スクレイピング(Webからの必要情報の収集スキル)
  • 機械学習(Scikit-learnなどのライブラリの使い方)
  • 深層学習(TensorFlow、Keras、etc.、自然言語処理、画像認証、顔認証の簡単なプログラム)

の例題、ソースコードが付いていて、中級者以上に向けて書かれている感じなのですが、やっぱり難しかったです。

この手の本は、発売から時間が経つと、ライブラリやソフトウェアやサイトがアップデートされてしまっていて、ソースコードの写経では動かないところが増えてきます。

環境もWindowsとUbuntu(Docker+MacOSでの仮想OS)ではコマンドプロンプトやら、インストール方法、設定方法が変わってきます。

Wikipediaの全文データをDLして、形態素解析にかけてベクトル化処理して、言葉遊びをしようという例題があり、

面白そうだったのでこれだけ頑張ろうと思いましたが、仮想OSの導入で、Docker Desktop for WindowsはWindows 10 Homeでは対応していないと知り、Docker ToolboxがDockerのHPでは見つからず、ネットを探してようやく見つけてインストールまでは出来ましたが、初期設定がエラーで進まず。

BIOSのCPUの設定を変えなければ、インストール出来そうにないということ。

かれこれ丸一日奮闘に費やし、そこまで必要なものではないと気づいて断念しました。

チャットボット作りなんかも面白そうでしたが、ネットを調べるとチャットボット作成サービスを利用した方が圧倒的に早いし良いものが出来そうでした。

こういう「車輪の再発明」をしないように事前のリサーチをしっかりしないとなと思いました。

エンジニアの仕事の大半は検索と試行錯誤と聞くと、納得できました。

AIとか、機械学習は一時期よりは落ち着いてきましたが、ホットな話題ということもあり、調べていると初心者向けの機械学習短期講座だの、セミナーが数万~数十万で販売されていて、目的がはっきりしていないと高い勉強料になるだけなんだろうなと想像できました。

専門外の領域の専門書は、難しいなと実感。

切り替えて、次の学びに移りたいと思いました。

ABOUT ME
アバター
kanchan
一般内科、消化器内科、救急、脳神経外科、大学病院、関連病院、民間病院。色々な医療現場を経験してきました。 医療×テクノロジーで未来を創造することが夢です。

COMMENT

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です