Chatbotを作ってみた

キャラクターなどをテキストでお喋りさせるプログラムを作ってみました。使っている環境は以下の通りです。

  • python
    • 勉強がてらに
  • sqlite
    • データ部分をファイル単位で管理できる点が、ポータビリティの点で気に入ったから
  • mecab
    • 日本語形態素解析では一番メジャーと思われる

アルゴリズム

基本はマルコフ連鎖モデルです。与えられた入力文を形態素解析で分解し、要素Aの次にくる要素について、その繋がりを学習データとしてカウントします。文章を作成する際は、繋がりのカウントに応じた確率で、次に繋げるデータを選択していきます。

多少細かい調整も入っていますが、基本的な設計思想は上記の通りです。

作ってみての所感

結局のところ、データエントリ作業のほうが、大変です。20個くらい文章を与えると、それなりに新たなそれっぽい文章を作ってくれて楽しいのですが、如何せん少ないので、すぐに網羅してしまいます。予測不可能な面白さを生み出すには、1000個レベルとか必要ですね。

あと、キャラクターなどを模す場合は、そのキャラクターだとすぐに分かるフレーズを学習データとして与えないと、キャラクターのイメージからブレやすくなります。

学習アルゴリズムも重要ですが、学習データを効率的に収集できる仕組みも同じくらい重要だなあ、と思いました。Twitterのbotであるしゅうまいくんは、学習データの収集はほぼ自動で出来ていますものね。


履歴

  • 2017/08/14 : bokupi 新規作成

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: Mon, 14 Aug 2017 07:47:52 JST (66d)