BBS-掲示板 > 28


※上記の広告は60日以上更新のないWIKIに表示されています。更新することで広告が下部へ移動します。

精度マックス -- seren 2009-07-17 23:46:28


訳語検索の精度を半端なく向上させました。


昨日までの訳語検索だと、「少女」などを引く分には良かったです。
「魔法少女」や「少女りんご」が一緒に出るくらいで、件数も少ないですし。

ところが初心者ほど「手」や「指」みたいな簡単な単語を探しますよね。
しかし訳語検索をすると「手足」ならともかく、「手配」とか「指示」とか「指標」みたいな、明らかに手や指に関係ないものが出てきます。
そしてその数が100超えたりするんですよww

初心者が我慢してスクロールするのはせいぜい10~20だと思います。
明らかに限界突破ですw

そこで、ジャストミートするものだけ厳密に探すようにしました。
試しに「手」と「指」で検索してみてください。
PDICの用例検索時代と比べたら、感動すら覚えるかもしれんですwww
"niasにっこり検索"、かな?

ただ、精度を上げすぎたので、引っかからなくなったものもあります。
ジャストミート検索ですから、「yulを歩く」のようなものは「歩く」では引けません。

でもこれは検索でなくむしろ辞書データのほうが悪いでしょ?「歩く」くらい載せとけよと思うわけです。
それに、この検索システムにしたときの利点のほうが害よりもずっと多いのです。むしろ問題は辞書データ。
そこで、精度を上げてしまったがゆえに外れた項については、辞書をちまちま手で直していくことにします。

フィアンセ(少女霊)は、「フィアンセ、少女霊」にします。
リディア=ルティアも、「ルディア=ルティア、リディア」にしたほうがいいですね。
でも、手作業なしでここまで精度の高い検索を作れたのは幸運でした。

幸運だったのは、辞書のデータが綺麗でしっかりしていたことです。手打ちなのにね。
自画自賛ですが、いい加減人間のくせに几帳面に約物を打ってたんだなと感謝しました。



  • 今まで「青」とか調べるのがどれだけ大変だったか……。「青」でsoretが出るように。今の初心者はずいぶんラクになったもんですね、Kakisさん。 -- seren (2009-07-17 23:50:36)
  • 「赤」の本文検索271件www 訳語検索1件バロスwww -- seren (2009-07-17 23:52:01)
  • これは訳語部を読点でsplitして完全一致するものを抽出しているのでしょうか。基本語が一発で引けるようになったのは大きな前進ですね -- nias (2009-07-18 01:48:50)
  • 出力するhtmlの<head>と<title>の間に<meta http-equiv=content-type content="text/html; charset=Shift_JIS">入れても駄目です? >Firefox -- nias (2009-07-18 01:56:53)
  • 普通のボタンっていうのは今の検索ボタン・クリアボタンと同じボタンのことです。ラジオボタンで選択してから検索押すのは一手間なので -- nias (2009-07-18 01:58:56)
  • ローカルとサーバで挙動は違うのはローカルとサーバのperlの仕様が何か違うのかなぁ -- nias (2009-07-18 02:11:33)
名前:
コメント: