書籍情報

実践 Rによるテキストマイニング

センチメント分析・単語分散表現・機械学習・Pythonラッパー

徳島大学教授石田 基広(著)

  • ¥2,640
  • 160ページ
  • 978-4-627-88511-0
  • 2020.03

書籍のカテゴリー

  • 情報工学・コンピュータ

    機械学習・最適化

  • 数学

    確率・統計

ダウンロード

今やテキストマイニングは,文章を単語に切り分けて,単語の出現頻度を数えるだけにはとどまりません.

商品やイベントに対するSNS上の意見をポジティブ・ネガティブに分ければ,何が評価されて,どこを改善すべきかが一目瞭然.
政治家の演説のトピックが,時代とともにどう移り変わってきたかを解析すると,社会の変化を見て取ることもできます.
小説の話題展開の流れや,登場人物とキーワードの結びつきも,自動で分析可能です.


文書解析で本当にやりたかったこれらのことは,Rで手軽に実現できます.

テキストマイニング定番書の著者による,次の一歩のためのやさしい手引きです.
[もっと基本的なことから学びたい方は,同著者による「Rによるテキストマイニング入門[第2版](森北出版)」もご覧ください]

〈本書で扱う主な内容〉
●センチメント分析
 日本語極性辞書を用いて,単語の極性からテキスト全体がポジティブかネガティブか判断.
●単語分散表現
 単語の頻度だけでなく,出現位置に注目し,単語どうしの意味の関連性を数値化.
●機械学習,ディープラーニング
 機械学習を用いて,より高度な解析も実現.Pythonを前提とした訓練済みモデルやディープラーニングのフレームワークも,RStudioから簡単に利用可能.

第1章 Rによる日本語テキスト解析の基礎
第2章 センチメント分析
第3章 構造的トピックモデル
第4章 Twitter投稿テキストの評価
第5章 機械学習による予測
第6章 単語分散表現
第7章 RからPythonライブラリを実行

理工学系専門書,理工学系入門書の検索

詳細検索 >>