書籍情報

フリーソフトでつくる音声認識システム(第2版)

パターン認識・機械学習の初歩から対話システムまで

京都工芸繊維大准教授博(工)荒木 雅弘(著)

  • ¥3,672
  • 272ページ
  • 978-4-627-84712-5
  • 2017.04

書籍のカテゴリー

  • 情報工学・コンピュータ

    機械学習・最適化

  • 情報工学・コンピュータ

    画像・音声・信号処理

ダウンロード

・機械学習のしくみを知りたいけど、数学は苦手…
・専門書を読みたいけど、数式ばかりで挫折した…
という人を「機械学習の世界」に導く,おすすめの1冊!

前半部では、機械学習・パターン認識の基礎を学びます。機械学習の理論を学習しようとすると、高度な数学の知識が必要と思われがちですが、本書は「パターン認識ってなに?」といった初歩の初歩からかみくだいて解説しています。もちろん初歩だけでなく、ニューラルネットワーク・サポートベクトルマシンなどの重要トピックの理論的な側面まで、Scilab、Wekaを使ったパターン認識の演習を行いながら学ぶことができます。

後半部では、HTK、Julius、MMDなどのフリーソフトを使いながら音声認識システムをつくっていきます。音声やテキストに対してパターン認識を適用する際は、隠れマルコフモデル・N-gramなどの言語モデルに関する難解な知識が必要になりますが、手を動かすと同時に理論面も学習することによって、音声認識にとどまらない「実際の認識に使える」知識が身につきます。

「学びはじめの1冊に最適」と評判の機械学習の定番入門書が、リカレントニューラルネットワーク・畳込みニューラルネットワークなど近年の技術動向を反映した解説を加えて第2版となりました。

第1部 パターン認識の基礎
 第1章 パターン認識って何?
 第2章 データをきちんと取り込もう
 第3章 パターンの特徴を調べよう
 第4章 パターンを識別しよう
 第5章 誤差をできるだけ小さくしよう
 第6章 限界は破れるか(1) ―サポートベクトルマシン
 第7章 限界は破れるか(2) ―ニューラルネットワーク
 第8章 未知データを推定しよう ―統計的方法
 第9章 本当にすごいシステムができたの?

第2部 実践編
 第10章 声をモデル化してみよう ―音響モデルの作り方・使い方・鍛え方
 第11章 HTKを使って単語を認識してみよう
 第12章 文法規則を書いてみよう
 第13章 統計的言語モデルを作ろう
 第14章 連続音声認識に挑戦しよう
 第15章 会話のできるコンピュータを目指して

付録A 数学的な補足
付録B Scilab演習
付録C Wekaにおけるディープニューラルネットワークによる識別
付録D 読書ガイド

理工学系専門書,理工学系入門書の検索

詳細検索 >>