最近の(でもないけれど)出来事/落書帳/仲間内のネタ/覚え書き/whatsnew

基本的に落書き帳/メモ帳/備忘録なので、 わりと間違っていたり、 数分後とか後日とかに見たら、 いきなり消えていたり書き換わっていたりとかあります。


Fri,02 Jul,2010

Firefox 3.6.x
Thu,24 Dec,2009Mon,08 Feb,2010Wed,05 May,2010の続き。
Firefox 3.6.4 を普通にインストールしたら、普通に動いた。 今までの 3.6.x で苦労して動かなかったのは何だったのだろう、 と言うぐらいあっさり動いた。
ただ、Javascript の処理が遅くなった気がする。
あと、コンテキストメニューの表示が確実に遅くなった。

ビルド所要時間は2時間、 ビルド所要容量は 801MB。

Fri,29 Oct,2010に続く。

Sat,03 Jul,2010

V cube。
何時の間にやら、V cube 7 が売っていた。

FreeBSD の Firefox weave。
何時の間にやら ports から消えたと思ったら、 www/firefox-sync に名称変更したらしい。

Sun,04 Jul,2010

LINDBERG、BELIEVE IN LOVE、1990??????。

BOY MEETS GIRL、trf、1994.6.22。

サヨナラ、GAO、1992.4.21。

Tue,06 Jul,2010

現状でのインデックスファンドの比較。
まぁ、とは言っても買うお金は無いんだけれどもね。 STAM は 7/30 の改訂後の経費。

インデックスファンド一覧:日本株
名称買付手数料信託報酬手数料信託財産留保決算日マザーファンド規模その他の経費実質年間経費特典付きの販社
1306:01312017:(野村)TOPIX連動型上場投資信託(ETF) -.--%0.1155〜0.2520++%-.--% 7/10 5571億円信託報酬19.7円, 委託手数料0.0円, 保管管理3.9円

1348:03311095:(三菱UFJ)MAXISトピックス上場投信(ETF) -.--%0.0819++% -.--% 7/16, 1/16 81億円信託報酬??.?円, 委託手数料?.?円, 保管管理?.?円
カブドットコム(売買手数料無料)
1308:0231701C:(日興)上場インデックスファンドTOPIX(ETF) -.--%0.0924++% -.--% 7/08 1910億円信託報酬13.6円, 委託手数料0.1円, 保管管理5.4円

1305:04315017: ダイワ上場投信−トピックス(ETF) -.--%0.1155〜0.2415++%-.--% 7/10 1908億円信託報酬25.0円, 委託手数料0.0円, 保管管理4.0円

81316104: CMAM日本株式インデックスe 0.00%0.3885++% 0.00% 4/06 2610億円保管管理?.??%?.????/?.????%, 分配金?SBI証券(0.085%)
0331209A: eMAXIS TOPIXインデックス 0.00%0.4200++% 0.00% 1/26 1735億円保管管理0.00%0.4200/0.3350%, 分配金無SBI証券(0.085%)
64313081: STAM TOPIXインデックス・オープン 0.00%0.4830+0.00525+% 0.05% 5/10,11/101331億円保管管理0.00%0.4830/0.3980/0.4030%, 分配金無SBI証券(0.085%)とマネックス証券(0.08%)
02311862: (日興)インデックスファンドTSP 0.00%0.5460+0.0084?+% 0.00% 2/12 264億円保管管理0.02%0.5660/0.4810/0.4860%, 分配金多SBI証券(0.085%)とマネックス証券(0.08%)

インデックスファンド一覧:海外債券
名称買付手数料信託報酬手数料信託財産留保決算日マザーファンド規模その他の経費実質年間経費特典付きの販社
1677:(日興)上場インデックスファンド海外債券(Citigroup WGBI)毎月分配型(ETF)-.--%0.2625〜1575% -.--% x/10 22億円信託報酬??.?円, 委託手数料?.?円, 保管管理?.?円

81319104: CMAM外国債券インデックスe 0.00%0.5250++% 0.00% 4/06 4590億円保管管理?.??%?.????/?.????%, 分配金?SBI証券(0.085%)
64316081: STAM グローバル債券インデックス・オープン 0.00%0.5775+0.00525+% 0.05% 5/10,11/102999億円保管管理0.02%0.5975/0.5125/0.5175%, 分配金無SBI証券(0.085%)とマネックス証券(0.08%)
03313083: 三菱UFJ 世界国債インデックスファンド 0.00%0.6300++% 0.00% 1/17 2333億円保管管理0.04%0.6700/0.5850/0.5900%, 分配金少SBI証券(0.085%)とマネックス証券(0.08%)
0331609A: eMAXIS先進国国債インデックス 0.00%0.6300++% 0.00% 1/26 1489億円保管管理0.04%0.6700/0.5850%, 分配金無SBI証券(0.085%)
0231E01A: 年金積立インデックスF海外債券(ヘッジ無) 0.00%0.7035+0.00735+% 0.20%10/26 7253億円保管管理0.03%0.7335/0.6485/0.6535% 分配金少SBI証券(0.085%)とマネックス証券(0.08%)
81312012: 中央三井 外国債券インデックスファンド 0.00%0.7350++% 0.10% 2/21 4551億円保管管理0.03%0.7650/0.6800%, 分配金中SBI証券(0.085%)
54314013: PRU 海外債券マーケット・パフォーマー 0.00%0.6825+0.00525+% 0.10%12/10 99億円保管管理0.08%0.7625/0.6775%, 分配金無SBI証券(0.085%)
0231F01A: 年金積立インデックスF海外債券(ヘッジ有) 0.00%0.7035++% 0.20%10/26 294億円保管管理0.09%0.7935% 分配金少

インデックスファンド一覧:海外株式
名称買付手数料信託報酬手数料信託財産留保決算日マザーファンド規模その他の経費実質年間経費特典付きの販社
1680: (日興)上場インデックスファンド海外先進国株式(MSCI-KOKUSAI)(ETF) -.--%0.2625〜1575% -.--% 1/20 22億円信託報酬??.?円, 委託手数料?.?円, 保管管理?.?円

81318104: CMAM外国株式インデックスe 0.00%0.5250++% 0.00% 4/06 2884億円保管管理?.??%?.????/?.????% 分配金?SBI証券(0.085%)
0331509A: eMAXIS先進国株式インデックス 0.00%0.6300++% 0.00% 1/26 1201億円保管管理0.04%0.6700/0.5850%, 分配金無SBI証券(0.085%)
64314081: STAM グローバル株式インデックス・オープン 0.00%0.6300+0.00525+% 0.05% 5/10,11/101141億円保管管理0.03%0.6600/0.5750/0.5800%, 分配金無SBI証券(0.085%)とマネックス証券(0.08%)
7931A09A: 外国株式指数ファンド 0.00%0.5250+0.0063+% 0.30%11/30 2335億円保管管理0.18%0.7050%, 分配金無
81311012: 中央三井 外国株式インデックスファンド 0.00%0.8400++% 0.20% 2/21 2805億円保管管理0.06%0.9000/0.8150%, 分配金無SBI証券(0.085%)
0231C01A: 年金積立インデックスF海外株式(ヘッジ無) 0.00%0.8820+0.00945+% 0.30%10/26 716億円保管管理0.10%0.9820/0.8970/0.9020%, 分配金少SBI証券(0.085%)とマネックス証券(0.08%)
5531198C: ステート・ストリート 外国株式インデックス 0.00%0.9975++% 0.30%11/30 2865億円保管管理0.13%1.1275/1.0425%, 分配金多多多SBI証券(0.085%)
64315005: すみしん 外国株式インデックス・オープン 0.735+0.10%0.8400++% 0.10% 5/29 1218億円保管管理0.05%0.0.8900%, 分配金多多多多
54313013: PRU 海外株式マーケット・パフォーマー 0.00%0.8400++% 0.20%12/10 50億円保管管理0.33%1.1700/1.0850%, 分配金無SBI証券(0.085%)
75311036: トヨタアセット・バンガード 海外株式F 0.00%(0.24++1.0500+0.00525+)%0.00% 4/05 156(Growth)+116(Value)+110(EUR)+274(EM)億$保管管理0.02%1.3152/1.2352%, 分配金多多マネックス証券(0.08%)
03312046: (三菱UFJ)外国株式インデックスファンド 2.10%0.8295++% 0.10% 2/22 1156億円保管管理0.07%0.8995%, 分配金無
0231D01A: 年金積立インデックスF海外株式(ヘッジ有) 0.00%0.8820++% 0.30%10/26 11億円保管管理1.26%2.1420% 分配金少

Thu,08 Jul,2010

コンクリートロード。……。

google の巡回。
最近の基準は1〜2週間に1回らしい。 スコアの高いページは概ねそのくらいで、 スコアの低いページは1ヶ月以上とかそのくらい。

Sat,10 Jul,2010

おもちゃ系なんでもの中古屋。
普段通らない方の道を通って、偶然見つけたのだが。 CD コーナーにアニソン専用棚が3つあって、 そのうち1つが東方専用だった……。 何時の間にやら東方ってそんなに……。

Sun,11 Jul,2010

portupgrade -pcrR libXaw gettext
ディスク容量が足りなくなってきたので、 /usr/local/lib/compat/pkg/ 以下から適当に消してみた。
libXaw.so.8 と libintl.so.8 を消してしまった。 動かなくなったソフトウェア続出。
portupgrade でのパッケージ再構築が10日かかった。 途中、エラーで止まって手作業で修正した分を差っ引くと、 実質7日間くらいらしい。
インストールしてあるパッケージ数が約1100のところを、 約700パッケージほど再構築していた。

xvidcap-1.2.2 on FreeBSD-6.4。
/usr/ports/sysutils/xvidcap/work/xvidcap-1.1.4p1/src/main.c:937:
undefined reference to `av_free_static'
とかエラーを出して、ビルドが通らない。
web で検索してみても、海外を含めて20件くらいしか見つからない。
で、海外のサイトで「一旦 ffmpeg を消してから試してみ」(意訳)と あったので、試してみた。
ちゃんとビルド通ったよ……。
xvidcap の ffmpeg 呼び出し回りが駄目らしい。

ecawave-0.6.1 がビルドできない。
ecasound を 2.6.0(最新版は 2.7.1)にダウングレードしてから ecawave をビルドしたら、ちゃんと出来上がった。
ecawave が ecasound の最新版に追い付いていないらしい。

omniORB-4.1.x。
パッケージで入れた OpenSSL-1.0.0 には非対応らしい。
../../../../.././../src/lib/omniORB/orbcore/ssl/sslContext.cc: In member function `virtual SSL_METHOD* sslContext::set_method()':
../../../../.././../src/lib/omniORB/orbcore/ssl/sslContext.cc:182: error: invalid conversion from `const SSL_METHOD*' to `SSL_METHOD*'
gmake[5]: *** [static/sslContext.o] Error 1
とか出て、ビルドが通らない。
web で検索してみても、海外を含めて20件くらいしか見つからない。
どうやら OpenSSL のここ1年以内に行われた変更作業 (OpenSSL-0.9.x → OpenSSL-1.0.0)で、 SSLv23_method() の返り値が SSL_METHOD* から const SSL_METHOD* に 変更になったらしいのだが、 omniORB がそれに対応していなくて、ビルドが通らないらしい。
omniORB-4.1.3/src/lib/omniORB/orbcore/ssl/sslContext.cc の sslContext::set_method() での SSLv23_method() 呼び出しの返値を 無理矢理 (SSL_METHOD*) にキャストするか、 OpenSSL を 0.9.x にダウングレードしたら、 ビルドが通る様になった。

xconq-7.4.1 on FreeBSD。
そのままインストールしたら、 画面表示やコンテキストメニュー表示が ウィンドウサイズや表示領域のサイズを越えたりして、 なんか駄目駄目だった。
ports/games/xconq/Makefile の 「USE_TK=yes」を「USE_TK_RUN=84」に変えて、 使用する TCL/TK のバージョンを 8.5系から 8.4系にダウングレードしたら、 ちゃんと表示される様になった。 まぁこれは何年も前からずっとそうなのだけれども。

Wed,14 Jul,2010

自転車がパンクした。前輪。
車道から歩道への段差の所で、 いきなり全部の空気が抜けるぐらい激しくパンク。 左サイドの上下、合わせて2ヶ所に開いていたので、 リム打ちパンクというやつらしい。
……タイヤの空気圧の調整をしたばっかりのその日なのになぁ……。

Fri,16 Jul,2010

OpenBSD で autoconf/automake。 Mon,25 Jan,2010 の続き。
OpenBSD のパッケージの autoconf/automake だと BSD版m4 を使うのだが、 GNU版m4(以下 gm4 と呼称)との互換性?の問題が有り、 automake でエラーが出て使えない。
あと、autoconf-archive パッケージが無いので、 .m4 ファイルが足らない、とかなる。
その対処法。

まず、パッケージの m4(GNU m4)をインストールする。

gm4 を使用する autoconf-2.64 をインストールする:
環境変数 M4 を指定して、強制的に gm4 を使わせる。
% env M4=/usr/local/bin/gm4 ../configure --program-suffix=-2.64 --without-lispdir --prefix=/home/ghal/.bin/metaauto/
% make
% make install

autoconf archive をインストールする時:
% ../configure --prefix=/home/ghal/.bin/metaauto/
% make
% make install

automake-1.10.x をインストールする時:
% ../configure --prefix=/home/ghal/.bin/metaauto/
% make
% make install

libtool-2.2.6 をインストールする時:
% ../configure --prefix=/home/ghal/.bin/metaauto/ --disable-ltdl-install
% make
% make install



aclocal を実行する時:
% env LANG=C AUTOM4TE=/home/ghal/.bin/metaauto/bin/autom4te-2.64 ~/.bin/metaauto/bin/aclocal-1.10 -I ./m4 --install
ここで、環境変数 AUTOM4TE を指定しないと、
autom4te を /usr/local/bin へ探しに行ってしまい、見つけられず、
Use of uninitialized value in exists at /home/ghal/.bin/metaauto/bin/aclocal-1.10 line 691, <GEN45> line 1.
Use of uninitialized value in string eq at /home/ghal/.bin/metaauto/bin/aclocal-1.10 line 693, <GEN45> line 1.
Use of uninitialized value in string eq at /home/ghal/.bin/metaauto/bin/aclocal-1.10 line 693, <GEN45> line 1.
Use of uninitialized value in string eq at /home/ghal/.bin/metaauto/bin/aclocal-1.10 line 693, <GEN45> line 1.
Use of uninitialized value in string eq at /home/ghal/.bin/metaauto/bin/aclocal-1.10 line 698, <GEN45> line 1.
とエラーを出してこける。
正しく実行されると、autom4te.cache と aclocal.m4 が生成され、
./m4 に適当にファイルがコピーされる。

% env LANG=C ~/.bin/metaauto/bin/autoheader-2.64
config.h.in が生成される。

% env LANG=C ~/.bin/metaauto/bin/autoconf-2.64
configure が生成される。

% env LANG=C AUTOCONF=/home/ghal/.bin/metaauto/bin/autoconf-2.64 ~/.bin/metaauto/bin/automake-1.10 -a -c --foreign
gm4を使う autoconf を指定して automake を実行する。Makefile.in が生成される。
ここで、環境変数 AUTOCONF を指定しないと、
Use of uninitialized value in exists at /home/ghal/.bin/metaauto/bin/automake-1.10 line 4839, <GEN0> line 1.
Use of uninitialized value in concatenation (.) or string at /home/ghal/.bin/metaauto/bin/automake-1.10 line 4839, <GEN0> line 1.
automake-1.10: ####################
automake-1.10: ## Internal Error ##
automake-1.10: ####################
automake-1.10: unrequested trace `'
automake-1.10: Please contact <bug-automake at gnu.org>.
 at /home/ghal/.bin/metaauto/share/automake-1.10/Automake/Channels.pm line 570
        Automake::Channels::msg('automake', '', 'unrequested trace `\'') called at /home/ghal/.bin/metaauto/share/automake-1.10/Automake/ChannelDefs.pm line 191
        Automake::ChannelDefs::prog_error('unrequested trace `\'') called at /home/ghal/.bin/metaauto/bin/automake-1.10 line 4839
        Automake::scan_autoconf_traces('configure.ac') called at /home/ghal/.bin/metaauto/bin/automake-1.10 line 5062
        Automake::scan_autoconf_files() called at /home/ghal/.bin/metaauto/bin/automake-1.10 line 7844
とエラーを出してこける。



備考:
libtool-2.2.6 をインストールせずに、パッケージの libtool-1.5.26p0 を使用すると、
aclocal 実行時に指定した「-I ./m4 --install」に従わず、
libtool.m4 等の libtool関連が ./m4 にコピーされずに aclocal.m4 にマージされる。



と言うわけで、Anthy 拙作パッチの、
aclocal/autoheader/autoconf/automake のバージョンアップに成功したらしい。

Anthy 拙作パッチ。
かな漢字変換 anthy で、個人用学習データを活用して変換結果の改善を目指すパッチ

alt-depgraph同梱版の3種(旧安定版、安定版、実験版)にて、 autoconf-2.64 / autoconf-archive-2009-04-19 / automake-1.10.3 / libtool-2.2.6b に更新。
patch13B-23-iconv-ucdict(安定版)と patch13B-23-iconv(旧安定版)に、 複合品詞に学習が適用されないバグ修正を、実験版からバックポート。
patch13Bptn23.iconv(旧安定版の alt-depgraph 非同梱版)にて、 郵便番号辞書バッファサイズの拡張と、 複合品詞に学習が適用されないバグ修正を、 実験版からバックポート。

最近、 FreeBSD のパッケージをソースからインストールしようとすると、
===> License check disabled, port has not defined LICENSE
と出る様になった。なんだろう。

の「2010/05/31 18:53:30| RHa:」らしい。

Sat,17 Jul,2010

msdosfs 内に mp3 を置いて再生すると、 バッファアンダーランを数分に1回のペースで起こして その度に音飛びして困る。

ようやく、 ∀ガンダムのサントラ3枚を買い揃える事ができた。 中古だけどさ……。 劇場版はパス。

Sun,18 Jul,2010

鉄騎が¥8,000- で売っていた……。

森の路はずれ - 「PERFECT WORLD」(「天空のエスカフローネ」より)
ここ1年くらいで「PERFECT WORLD」と言ったら、 「狼と香辛料 第2期 ED」じゃないんですか。 とか脊髄反射で言ってみるテスト。

かな漢字変換。
間違えて「せきついはんしゃ」とタイプしたら、 『「せきずいはんしゃ」の間違い?』と 提示してくれる何かが欲しいと思った。

Anthy の文節区切り学習。
2007年9月2日から 2010年7月18日までの2年10ヶ月程度で、 文節区切り学習のデータが 1.3MB くらい貯まっていた。
このくらい貯まっていると、変な変換も滅多に出ないしなぁ。
と言うわけで?、 後述の実験版 patch13-testing で実装する文節区切り方式のテストを兼ねて、 既存の文節区切り学習を全部削除して 新規学習も無効にしてみるテスト。

Mon,19 Jul,2010

渡辺美里、My Revolution、1986.1.22。
ぎゃぁ、曲の途中から……何て言うの?パーソナリティのトーク?を 入れやがった。

小田和正、たしかなこと、2005.5.25。

Anthy 拙作パッチ。
かな漢字変換 anthy で、個人用学習データを活用して変換結果の改善を目指すパッチ

configure の --help の内容で TYPO みつけた……。
リポジトリは治したけれど、公開版パッケージ直すのメンドクサ……。 結局、21日に治した。

Wed,21 Jul,2010

Anthy 拙作パッチ。
かな漢字変換 anthy で、個人用学習データを活用して変換結果の改善を目指すパッチ

安定版/実験版の3種にて、 configure の --help の内容の TYPO を修正。

本サイトの rss にて、 何か色々表記が間違っていたので修正。

実験版の表記を patch13B-23-iconv-ucdict-combinedphrases から patch13-testing に変更。
patch13B-23-iconv (旧安定版)と patch13Bptn23.iconv(旧安定版の alt-depgraph 非同梱版)と patch13B-23-iconv-ucdict-combinedphrases の メンテナンスは終了。

Anthy 拙作パッチ。
かな漢字変換 anthy で、個人用学習データを活用して、なんかもう思い付く事を何でもかんでも試してみて、変換結果の改善を目指すパッチ

実験版 patch13-testing にて、 MBRビタビモードにおける文節区切りデータベースの 作り方を変更。
原作版 Anthy でのデータベース作成方法を IID モードと呼称、 今回新たに作ったデータベース作成方法を IDI モードと呼称。
configure の --with-corpus-analysis-mode=IID もしくは --with-corpus-analysis-mode=IDI にて選択。

IDIモードや IIDモードでの変換結果ってどんなもんよ、 と言う話は、 Sat,07 Aug,2010Sun,08 Aug,2010を 参照。

IDIモードや IIDモードの具体像ってどんなんよ、 と言う話は、 下記延々と参照。

具体的なデータベースの変更内容:
原作版 anthy では、コーパスに
|文節を|区切る|| は文節区切り位置)
と言う内容が有った場合、
品詞クラス文頭
|品詞クラス名詞+格助詞品詞#T付属語クラス格助付属語ハッシュhash(を)
|品詞クラス動詞+連体品詞#R5付属語クラス連体付属語ハッシュhash(る)
|品詞クラス文末
と言う情報に変換してから、
第1区切り情報品詞クラス文頭→名詞+格助詞|品詞クラス名詞+格助詞品詞#T付属語クラス格助付属語ハッシュhash(を)
第2区切り情報品詞クラス名詞+格助詞→動詞+連体|品詞クラス動詞+連体品詞#R5付属語クラス連体付属語ハッシュhash(る)
第3区切り情報品詞クラス動詞+連体→文末|品詞クラス文末
と言う情報に変換し、この区切り情報から確率情報データベースを生成し、
文節区切りを決める時に用います。

(但し、原作版 Anthy では、品詞クラス文末に連結する情報、
この例では第3区切り情報が使われないバグがある模様ですが)

(注意説明をわかりやすくする為に、一部事実と異なる部分があります)。

さて、この文節区切り情報を逆に考えてみると、
各区切り情報において利用している元のコーパス情報は、
第1区切り情報文頭|文節を
第2区切り情報文節*|区切る
第3区切り情報区切*|文末
の部分だけ、と言う事になります。
呼称が無いと困るので、この形態を I+ID モード、もしくは IID モードと呼称する事にします。

ここで思ったのが、
「文節区切り情報には、文節区切り位置の直前直後の情報を用いる方が良いのではないだろうか」
と言う事です。
例えば、
第1区切り情報文頭|文節*
第2区切り情報文節を|区切*
第3区切り情報区切る|文末
こんな感じに情報を用いる方が、妥当ではないかと思いました。
そしてその様に改造したのが、patch13B-testing.2010721版です。
呼称が無いと困るので、この形態を ID+I モード、もしくは IDI モードと呼称する事にします。

実際のプログラム上では、コーパス例文を、
第1区切り情報品詞クラス文頭→名詞+格助詞|品詞クラス名詞+格助詞品詞#T
第2区切り情報品詞クラス名詞+格助詞→動詞+連体付属語クラス格助付属語ハッシュhash(を)|品詞クラス動詞+連体品詞#R5
第3区切り情報品詞クラス動詞+連体→文末付属語クラス連体付属語ハッシュhash(る)|品詞クラス文末
と言う情報に変換し、この区切り情報から確率情報データベースを生成し、
文節区切りを決める時に用います
(原作版 Anthy にあった、「品詞クラス文末に連結する情報が無視される」件も修正済み)。

で、実際の IIDモードと IDIモードの違いって、どんなもんなんでしょうねぇ。
今までは文節区切り学習を貯め続ける試験をずっと続けていたので、
データベース生成方法の変更前後での文節区切り結果の違いがよく判らなかったり……。

また、Anthy の構造上の問題で、別の影響が出ます。
文節区切り位置決定は上述の通りなのですが、
その次に行われる変換候補決定でも同じデータベースを用いているらしく
(いや、データベース自身は trans_info と cand_info で
別データベースになっているのですが、
trans_info も cand_info も生成時に parsed_data の同じ部分を使っているので……)、
原作版での変換候補決定では
第1連結情報文頭|文節をを使って「文節を」という変換候補を、
第2連結情報文節*|区切るを使って「区切る」という変換候補を、
提示します。ところが拙作改造版 testing では
第1連結情報文頭|文節*を使って「文節を」という変換候補を、
第2連結情報文節を|区切*を使って「区切る」という変換候補を、
提示します。

この変換候補決定においては、原作版の方が良いかもしれません。

あるいは
第1連結情報文頭|文節をを使って「文節を」という変換候補を、
第2連結情報*を|区切るを使って「区切る」という変換候補を、
となる改造を試してみるとか。
どちらにしても改造が大きすぎて嫌だなぁ。

その他、デバッグ中に文節ツリー情報中の確率情報を 眺めていて感じたのが、
VITERBI_MODE_BIAS_SUBSTITUTES_POISSON 2.75e-06
で指定するバイアス値の影響がかなり大きそう。 試しに 1.0 を指定した所、 変換結果が目に見えてグチャグチャになりました。

カルネージハートの新作が出るらしい。
無茶するなぁ……、それとも勝算が有るのだろうか。
6作目らしいが、そんなに出ていたっけ……。 初代無印と EZ は、別に数えるらしい。 それから、PSP版が1本出ているらしい。 あれ、そうするとパソコン版が勘定に入りませんよ……。

Thu,22 Jul,2010

Anthy にてコーパスに追加を行う際に、
データベース生成の所要時間を何とか短縮する方法。

事前に、
make update_params0 ; make update_params ; make update_params2
が(update_params2 は0回以上の必要回数分)完了している事。
「corpus.g.txt」が、追加したい例文。

% cd build/calctrans
% ./proccorpus ../../calctrans/corpus.g.txt > parsed_data2.add
	→ 大元のデータベースを生成
% ./calctrans parsed_data parsed_data2 parsed_data2.add -o ../../calctrans/corpus_info
	→ 遷移データベースを生成
% ./calctrans parsed_data parsed_data2 parsed_data2.add -e -o ../../calctrans/weak_words
	→ 単語データベースを生成
% make do_update_params
	→ 辞書化用データベースを生成
% cd ..
% make
	→ 辞書を生成


たぶん、こんなんでいいと思うのだけれども。

Wed,28 Jul,2010

Anthy 拙作パッチ。
かな漢字変換 anthy で、個人用学習データを活用して変換結果の改善を目指すパッチ

実験版(patch13-testing)にて、 通常の動詞を複合動詞と誤判定してしまう場合があるバグを修正。
なお、後述の通り、未修正のバグがまだ残っています。
実験版 2010728版では、 後述のバグを踏まない程度の修正にとどめて有りますので、 通常の運用には耐えられると思います。

Thu,29 Jul,2010

Anthy 拙作パッチ。
かな漢字変換 anthy で、個人用学習データを活用して変換結果の改善を目指すパッチ

実験版(patch13-testing)にて、 1文節を構成する際に3語以上にできないバグだか仕様だかを修正。
名詞接頭辞付きで1文節化する機能を追加。

以下、昨日と今日で修正した箇所の詳細。

問題が発生する該当リリース:anthy-9100h.patch13-testing-2010721.alt-depgraph-100603d.alt-cannadic-100603-patch100628.zipdic-201005-patch100614

●余題
・「えき」を変換すると、「|絵|木|」と2文節になる。
  これはコーパスの確率絡みなので、手動でどうこうするものではなし。
  例文に1文節の内容を適当に追加して様子見しながら半放置が関の山。

●本題
・「えき」を1文節で変換すると、
	「得き」、「獲き」
	「得来」、「獲来」、「え来」
	「得着」、「獲着」、「え着」
  が出てくる。これは明らかにおかしい。これは何が原因だろう?

●関連情報
・安定版(patch13B.iconv.ucdict)版およびそれ以前だと、
	「得き」、「獲き」
  だけ出現した。

・gcanna.t に、
	「#KS 獲」、「#KS 得」、「#KS え」、「#kxi 得」、「#kxi え」
	「#kxi 来」、「#kxi き」、「#KS 着」、「#KS き」
  があると、問題が発生する。

●分析
・各単語に複合品詞の属性が付いており、各属性は
	え:(1N=D2Dl,100,Vy,29100,Sy,#kxi,HvCySy,E:0,F:450,LF:0,D:0,L:0,S)1,024,528
	得:(=D2Dl,100,Vy,29100,Sy,#kxi,HvCySy,E:0,F:450,LF:0,D:0,L:0,S)1,024,414
	獲:(=D2Dl,100,Vy,29100,Sy,#KS,HvCySy,E:0,F:400,LF:0,D:0,L:0,S)797,184

	き:(1N=D2Dr,100,Vy,19660,Sy,#kxi,HvCySy,E:0,F:650,LF:0,D:0,L:0,S)1,014,358
	来:(=D2Dr,100,Vy,19660,Sy,#kxi,HvCySy,E:0,F:650,LF:0,D:0,L:0,S)1,014,281
	着:(=D2Dr,100,Ve,19660,Se,#KS,HvC_Se,E:0,F:600,LF:0,D:0,L:0,S)983,639
  となっていた。
  実験版のみに Fri,27 Nov,2009 に追加した「動詞連用形動詞」の複合品詞の機能が、
  一般の動詞に対しても成立してしまっているらしい。

●原因および対処
・複合品詞判定に
  anthy_get_seq_ent_wtype_freq(seq,anthy_wtype_d2d)
  を使うのでは、
  一般の動詞と複合品詞の動詞の両方を含む品詞グループにも該当してしまい、
  駄目らしい。
・if (SCOS_CV == anthy_wtype_get_scos(*w2))
  にて、複合動詞のみの品詞グループが検出できないのは、
  品詞グループ「動詞連用形動詞」の追加に失敗している為らしい。
・品詞グループを追加する際には、
  src-worddic/wtab.h → src-worddic/ptab.h → depgraph/indepword,txt と、
  3段階全ての箇所に品詞グループ情報を登録しないと、
  品詞グループとして認識されないらしい。

・以上を、Wed,28 Jul,2010版で修正。


●そしてエンバグ
・複合品詞の連結は、右から左に行われるらしい。
  なので、複合品詞を作るか否かの判定の際に、
  左側に連結が可能な文節が来ると共に、
  右文節候補として既に連結済みの文節が来る事が有るので、
  それにも対応しなくてはならない。

・以上を、Thu,29 Jul,2010版で修正。


●さらに埋もれていたバグ発見
・Anthy には、複数の語を連結して1文節とする機能が有るのですが、
  原作版 Anthy では、2語の連結までしか対応していないっぽい……。
  3語以上を連結したら SIGSEGV 出しおった……。
  具体的には、src-splitter/compose.c の make_candidate_from_combined_metaword() にて、
  mw2 の make_cand_elem_from_word_list() の呼び出しで NULL を渡してしまい落ちる。

・以上を、Thu,29 Jul,2010版で修正。

Fri,30 Jul,2010

PRINCESS PRINCESS、世界でいちばん熱い夏、1987.7.16。

爆風スランプ、Runner、1988.10.21。

Google の SSL証明書。
urlclassifier 用の sb-ssl.google.com:443 の証明書が、 6月中旬〜7月中旬の間に更新されていたらしい。
Equifax のルート証明書を利用禁止にしていると sb-ssl.google.com:443 の末端の証明書も禁止になってしまい、 sb-ssl.google.com:443 の証明書の更新毎に 新しい証明書を再インストールしないといけないので注意。
これを行わないと、urlclassifier3.sqlite が更新されなくなってしまう。

ローカルの計算機の時計。
15 Apr,2010 から 31 Jul,2010 までで 22.2秒ずれていた。
107日間だから1日当たり 0.2秒ずれている勘定になる。

Google の SSL証明書の話と、 計算機の時計の話は、 Thu,16 Sep,2010 に続く。

Mon,02 Aug,2010

FreeBSD での ports/package 操作。

/usr/ports 以下のポーツ/パッケージ情報の更新。
% portsnap fetch update

/usr/ports/INDEX* の更新。
% portsdb -Fu

ポーツ/パッケージのゴミ掃除。
% portsclean -CDL

指定パッケージの下請けパッケージの更新状況を確認。
% portversion -vR PACKAGE-NAME

パッケージの新規インストール。 環境設定(make config)を先にまとめて行う。 依存先パッケージも自動更新。
% portupgrade -cpRN PACKAGE-NAME

BOY MEETS GIRL、trf、1994.6.22。

Firefox3。
urlclassifier3.sqlite のサイズが 34062336 まで大きくなった所で、それ以上大きくならずに止まっていた。 vacuum と reindex をかけたら 24190976 まで減った。
でも何で 34062336 で止まったのだろう? …… Fri,30 Jul,2010の、 証明書の更新を忘れた件が原因だった。

Wed,04 Aug,2010

Anthy 拙作パッチ。
かな漢字変換 anthy で、個人用学習データを活用して変換結果の改善を目指すパッチ

安定版(patch13B.iconv.ucdict)と 実験版(patch13-testing)にて、 文節区切り学習の反映確率が不適切な例が発覚、調整中。 実験版のみ更新して様子見中。
応急処置としては、環境設定ファイル ${HOME}/.anthy/conf に、
VITERBI_MODE_LATTICE_BIASPROB_BY_OCHAIRE 3.0e-3
Wed,11 Aug,2010 追記:
VITERBI_MODE_LATTICE_BIASPROB_BY_OCHAIRE 1.0e-2
を追加して下さい。 修正版へのバージョンアップ時に、削除する事を忘れずに。

以下、これまでの経緯。
Wed,11 Aug,2010に続く。

nosuke(のすけ)氏 - 日記みたいな何か - 2010年 7月30日 (金) - Anthy」
> 「じつげんかのう」とか「じっこうかのう」などの,「〜かのう」ってやつが
> 「実現 + 可能」とかにならずに必ず「実現かのう」になっちゃいます・・・.
> 文節切り直して確定しても全然覚えてくれない感じ.
結論だけ先に言うと:
文節区切り学習の反映確率が、対立候補の確率よりも小さかった。


●Sun,01 Aug,2010 〜 Mon,02 Aug,2010 の分析結果:

●前書き
 どの系列の、どのバージョンで、どんな環境設定なのかを
明記して頂かないと、追試が困難です……。
 過去の日記の内容から憶測して
「安定版 anthy-9100h.alt-depgraph.patch13B.iconv.ucdict 2010507版」
だろうと当たりを付けて試してみましたが。
が、再現できませんでした。

●本題
(1) 学習できているかの確認

 「じつげんかのう」を「|実現|可能|」として確定した際に、
学習データ「${HOME}/.anthy/last-record2_default」もしくは
「${HOME}/.anthy/last-record2_default.utf8」の最後に

ADD "OCHAIRE" S"じつげんかのう" N2 N4 S"実現" N3 S"可能" N0 N1 N0 N1 N1 T-1280598869 F1 ADD "OCHAIRE" S"じつげんかのう" N2 N4 S"実現" N3 S"可能" N0 N2 N0 N1 N2 T1280599079 F2 ADD "OCHAIRE" S"じつげんかのう" N2 N4 S"実現" N3 S"可能" N0 N2 N0 N2 N2 T1280599079 F2 ADD "CAND_HISTORY" S"じつげん" O1280599079 N1 S"実現" T1280599079 F2 ADD "CAND_HISTORY" S"かのう" O1280599079 N3 S"可能" T1280599079 F4 ADD "CAND_HISTORY" S"じつげん" O1280599079 N2 S"実現" T1280599079 F2 ADD "INDEP_HISTORY" S"じつげん" O1280599079 N2 S"実現" T1280599079 F2 ADD "DEP_HISTORY" S"" T1280599079 F7 ADD "CAND_HISTORY" S"かのう" O1280599079 N4 S"可能" T1280599079 F4 ADD "INDEP_HISTORY" S"かのう" O1280599079 N4 S"可能" T1280599079 F4 ADD "DEP_HISTORY" S"" T1280599079 F8
と追加されていれば、学習の覚える方は正常です。 上記の "OCHAIRE" の行にて、文節を切る事を学習しています。 (2) 環境設定が適切かどうかの確認 (2-1) 前方n文節最長一致モードの場合。 LATTICE_WITH_OCHAIRE_STRONG true LATTICE_WITH_CAND_SCORE true LATTICE_WITH_CANDSTRUCT_SCORE true を指定する必要があります。 前方n文節最長一致モードでこれらのオプションを指定しないと、 文節区切り学習が非常に(全くと言っていいくらい)反映されにくくなります。 (2-2) MBRビタビモードの場合。 MBRビタビモードの場合、(2-1) で述べた3つは false にした方が結果が良くなります。 あとは、学習を再現する確率を VITERBI_MODE_LATTICE_BIASPROB_BY_OCHAIRE 1.0e-3 くらいにして、学習の効果を強くしてみるとか……。 ●Tue,03 Aug,2010 までの分析結果: ・安定版(patch13B-23-iconv-ucdict)2010720版では MBRビタビモード、前方n文節最長一致モード、両モード共に現象を確認できず。 ・実験版(patch13-testing)2010729版の前方n文節最長一致モードでは現象を確認できず。 ・実験版(patch13-testing)2010729版の MBRビタビモードにて、 「|実行|可能|」(|じっこう|かのう|)を学習して覚えても、 変換結果に反映されず「|実行かのう|」(|じっこうかのう|)になる 場合がある事を確認。 但し、「|実現|可能|」v.s.「|実現かのう|」(|じつげんかのう|)は現象を再現できず。 ・オプション VITERBI_MODE_DECREASE_PROBABILITY_PHRASE_WITH_PRE_POST が false の場合、発生しやすい。 ・オプション VITERBI_MODE_DECREASE_PROBABILITY_PHRASE_WITH_PRE_POST false かつ オプション VITERBI_MODE_LATTICE_BIASPROB_BY_OCHAIRE を 3.0e-5 まで小さくすると、多発する。 ・オプション VITERBI_MODE_DECREASE_PROBABILITY_PHRASE_WITH_PRE_POST false かつ オプション VITERBI_MODE_LATTICE_BIASPROB_BY_OCHAIRE を 3.0e-5 まで小さくすると、 安定版(patch13B-23-iconv-ucdict)2010720版でも発生した。 ・オプション VITERBI_MODE_DECREASE_PROBABILITY_PHRASE_WITH_PRE_POST false かつ オプション VITERBI_MODE_LATTICE_BIASPROB_BY_OCHAIRE を 3.0e-5 まで小さくすると、 「|実現かのう|」(|じつげんかのう|)も再現した。 ・オプション VITERBI_MODE_LATTICE_BIASPROB_BY_OCHAIRE を 2.0e-3 まで大きくすると、発生しなくなった。 ●Tue,03 Aug,2010 までの仮の結論: ・文節区切り学習を反映する確率が小さすぎるらしい。 VITERBI_MODE_LATTICE_BIASPROB_BY_OCHAIRE 2.0e-3 まで文節区切り学習の反映確率を高めた所、発生を抑えられた。 取り敢えず、 VITERBI_MODE_LATTICE_BIASPROB_BY_OCHAIRE 3.0e-3 くらまで高めた方が良いかもしれない。 # 現時点における # VITERBI_MODE_LATTICE_BIASPROB_BY_OCHAIRE のデフォルト値は 3.0e-4。 # 1桁上げないと駄目らしい。 ・系列や版によって、発生したりしなかったりマチマチなのは、 対立変換候補のコーパスのデーターベースでの確率値が 各々の系列や版によってバラバラである為だと思われる。 ●Wed,04 Aug,2010 までの分析結果: ・前提情報の確認: オプション VITERBI_MODE_DECREASE_PROBABILITY_PHRASE_WITH_PRE_POST true にすると、接頭辞/接尾辞が付いている場合に強制的にコーパスの確率を下げる。 false だと、コーパスの確率を変更しない。 ・以下の構成となる変換候補 接頭辞:無し 自立語:「十」#NN、「10」#NN、「10」#NN、(じっ) 接尾辞:「校」#JS、「講」#JS、「項」#JS、(こう) 付属語:「かのう」(かのう) が生成され、これが「|じっこうかのう|」の文節区切り候補の1つとして存在しているらしい。 ・実際の文節区切り確率は 「|実行|可能|」(学習反映率:3.0e-3) 確率:2.843e-06 = 2.527e-00 * 1.125e-00 * 1.0e-06 「|十校かのう|」(接尾辞判定:false) 確率:4.906e-07 = 4.906e-01 * 1.0e-06 「|実行|可能|」(学習反映率:3.0e-4) 確率:2.883e-08 = 2.563e-01 * 1.125e-01 * 1.0e-06 「|実効かのう|」(品詞:#T35) 確率:2.412e-09 = 2.412e-03 * 1.0e-06 「|実行かのう|」(品詞:#T30) 確率:2.341e-09 = 2.341e-03 * 1.0e-06 「|実行|可能|」(学習反映率:3.0e-5) 確率:3.288e-10 = 2.922e-02 * 1.125e-02 * 1.0e-06 「|十校かのう|」(接尾辞判定:true) 確率:3.925e-13 = 3.925e-07 * 1.0e-06 となっていた。 変更前の学習反映率は 3.0e-4。 学習反映率はオプション VITERBI_MODE_LATTICE_BIASPROB_BY_OCHAIRE で指定する。 接尾辞判定はオプション VITERBI_MODE_DECREASE_PROBABILITY_PHRASE_WITH_PRE_POST で指定する。 ・コーパスの例文に、数字/数値で始まる例文が真269個、偽18個ある為に、 「|十校かのう|」(接尾辞判定:false) の確率が異様に高くなるらしい。 その事も有り、 オプション VITERBI_MODE_DECREASE_PROBABILITY_PHRASE_WITH_PRE_POST false の場合、「|じっこうかのう|」の文節区切り候補の確率が異様に高くなるらしい。 ・デバッグトレース中に、 #T30 の「|実行かのう|」は最終候補に残るのに #T35 の「|実効かのう|」は最終候補に残らない、 と言う謎現象がちょくちょく発生。 → src-splitter/lattice.c の push_node() の枝刈りにて、 かなり大甘な一致判定でバサバサと変換候補の削除を行っていた。 これは、バグなのか仕様なのか……。 # 結局、判定を厳しくした。 ●Tue,03 Aug,2010 の結論: ・昨日と同じ。文節区切り学習の反映確率の調整。

Thu,05 Aug,2010

Anthy 拙作パッチ。
かな漢字変換 anthy で、個人用学習データを活用して変換結果の改善を目指すパッチ

実験版(patch13-testing)の configure のバグ修正と corpusデータベース更新。

Fri,06 Aug,2010

ラジオの再生タイマー。
現時刻22:00からはどこそこを聴いて、 23:00からはどこそこに変えて聴いて、 00:00からはどこそこに変えて聴いて、 と言うのを、タイマーで設定しようと思ったら。
「タイマーは電源切のときのみ動作します。 設定後は本機の電源を切ってください。」
終わった……。

Sat,07 Aug,2010

そう遠くない所で、花火大会があった。 運良く良い場所で見る事ができた。

お題その1:Anthy の学習のデータサイズ。
お題その2:新規採用した IDIモードの誤答率。

IDIモードとか IIDモードとは何ぞや、 という話しは、 Wed,21 Jul,2010 を参照。

  • Anthy 拙作パッチ版の学習のデータサイズ、その1。
    文節区切り学習を全て無効にした状態で、 短文を約70文ほどタイプすると 40〜45KiB 消費した。 1文 600バイト前後。
    私の所で設定している1ラウンド? 524288B だと 約820文相当になる勘定。
    文節区切り学習を有効にすると、当然、 データ量は増えて総文数はもっと少なくはなる。

  • Anthy 拙作パッチ版の学習のデータサイズ、その2。
    JNetHack の jrumors.true を試し打ちの内容に使ってみた。
    50文で約 55〜56 KiB 消費した。 1文 1.1KiB 前後。
    1ラウンド? 524288B だと約460文相当になる勘定。
    実際には 100文タイプしたのだけれども記録を取り忘れた。

  • Anthy 拙作パッチ版の学習のデータサイズ、その3。
    じゃあ、実際の1文はというと、判らない。
    ので、 中を取って約860B で計算してみると、 1ラウンド? 524288B で約610文相当になる勘定。
    まぁそんなもんなんですかね。


  • Anthy の学習無し時の文節区切りの提示の誤答率、その1。
    コーパスの解析モードを IDI モードにして、 ふつーにかな漢字変換を使っていた所、 推定約420文程度タイプした辺りで、 文節区切り位置が望んだ位置になっていない変換候補の提示が 58文有った。
    条件として、入力する内容の単語は必ず辞書登録してある事。 それ以外の条件は一切無し。 但し、私がタイプした内容なので、若干硬めの文語には偏っている。
    結果、誤答率 約14%くらい。
    大きいんだか小さいんだかは不明。

  • Anthy の学習無し時の文節区切りの提示の誤答率、その2。
    同じく IDI モードで、 JNetHack の jrumors.true の先頭100文を 試し打ちの内容に使ってみた所、 誤答が続出。
    100文中20文が誤答だった。
    率にして20%。
    なんでしょうねぇ、この誤答率の6%の開きは……。

  • Anthy の学習無し時の文節区切りの提示の誤答率、その3。
    私の日常のタイプ推定約420文の結果と、 JNetHack の jrumors.true の100文をタイプした結果を、 合算して考えてみると、 推定約520文で誤答が78文。
    誤答率約15%。
    やっぱりそんなもんなんですかねぇ。

    Sun,08 Aug,2010 の IID モードでの誤答率の話に続く。

  • Sun,08 Aug,2010

    Anthy 拙作パッチ。
    旧安定版パッチ anthy-9100h.patch13Bptn23.iconv.2010720.bz2、 および、 旧安定版 anthy-9100h.patch13B-23-iconv.2010720.alt-depgraph-100603.alt-cannadic-100603.zipdic-201005-patch100608.tar.lzma を、 メンテナンス打ち切りにより削除。

    何となく勢いで Cascading Style Sheets 導入。

    Anthy 拙作パッチ。
    うあああぁぁぁ、特許3873305 の機能使いたい……。 この機能を封印したせいで複合動詞の表記の選択がつらい……。 2015年8月25日を越えれば、特許が切れて、 この機能を再実装できるのだが……。

    Sat,07 Aug,2010 の、 お題その1:Anthy の学習のデータサイズ。
    お題その2:新規採用した IDIモードの誤答率。
    の続き。
    今回は 「お題2:原作版 Anthy の処理である IIDモードの誤答率」 になります。

    IDIモードとか IIDモードとは何ぞや、 という話しは、 Wed,21 Jul,2010 を参照。

  • Anthy 拙作パッチ版の学習のデータサイズ、その1。
    前回と同様。

  • Anthy 拙作パッチ版の学習のデータサイズ、その2。
    JNetHack の jrumors.true を試し打ちの内容に使ってみた。
    50文で 57602B 消費した。 1文 約1152B。 1ラウンド? 524288B だと約455文相当になる勘定。
    100文で 117769B 消費した。 1文 約1178B。 1ラウンド? 524288B だと約445文相当になる勘定。

  • Anthy 拙作パッチ版の学習のデータサイズ、その3。
    前回同様、実際の1文での学習データサイズは、はっきりとは判らないので、 前回のその1と、今回のその1の、中を取って約883B で計算してみると、 1ラウンド? 524288B で約594文相当になる勘定。
    前回 610文と言う数字が出てきた事を考えると、 大体 600文前後なんですかね。 文節区切り学習が勘定に入っていませんが。


  • Anthy の学習無し時の文節区切りの提示の誤答率、その1。
    コーパスの解析モードを IID モードにして、 ふつーにかな漢字変換を使い推定約500文程度タイプした辺り (ここの whatsnew の Sun,18 Jul,2010 から 昨日まで)で、 文節区切り位置が望んだ位置になっていない変換候補の提示数。
    IDI モードと IID モードの両方で発生する誤答が 71文。 IDI モードのみで発生する誤答が 14文。 IID モードのみで発生する誤答が 34文。
    結果、IDI モードの誤答率が 17%くらい。
    結果、IID モードの誤答率が 21%くらい。
    IIDモードの方が悪く見えます。

  • Anthy の学習無し時の文節区切りの提示の誤答率、その2。
    コーパスの解析モードを IID モードにして、 JNetHack の jrumors.true の先頭100文を 試し打ちの内容に使ってみた所。
    IIDモードでは 100文中29文が誤答だった。 IDI モードと IID モードの両方で発生する誤答が 14文。 IDIモードでのみ間違えたのが 6文、 IIDモードでのみ間違えたのが 15文。 前方5文節最長一致モードでの間違いが全 27文。
    結果。
    IDI モードの誤答率が 20%くらい。
    IID モードの誤答率が 29%くらい。
    前方5文節最長一致モードの誤答率が 27%くらい。
    やっぱり IIDモードの方が悪く見えます。

  • Anthy の学習無し時の文節区切りの提示の誤答率、その3。
    私の日常のタイプ推定約500文の結果と、 JNetHack の jrumors.true の100文をタイプした結果を、 合算して考えてみると。
    全600文、 IDI モードと IID モードの両方で発生する誤答が 85文。 IDIモードでのみ間違えたのが 20文、 IIDモードでのみ間違えたのが 49文。
    結果、IDI モードの誤答率が 18%くらい。
    結果、IID モードの誤答率が 22%くらい。
    ここでも IIDモードの方が悪く見えます。 実際、どんなもんなんでしょうねぇ。


  • Mon,09 Aug,2010

    Anthy 拙作パッチ。
    かな漢字変換 anthy で、個人用学習データを活用して変換結果の改善を目指すパッチ

    バグ情報:安定版/実験版ともに、2010630版以降全て。   複合語に学習を適用し損なうバグを治したが、エンバグ。 複合語ではない一般単語で学習を適用し損なう場合がある事が発覚。
    自立語学習の際に、学習由来の変換候補に対して、 自立語学習に付属語も付加してしてしまうバグが発覚。   こちらは、2009年5〜8月頃からあった模様。
    testing版では修正完了。現在、動作確認中。

    Wed,11 Aug,2010

    Anthy 拙作パッチ。
    かな漢字変換 anthy で、個人用学習データを活用して変換結果の改善を目指すパッチ

    Wed,04 Aug,2010の続き。
    VITERBI_MODE_LATTICE_BIASPROB_BY_OCHAIRE 3.0e-3
    では、まだ小さいらしい。 「こうぶんけんさ」が、 いくら学習しても 「|項|文献さ|」(|こう|ぶんけんさ|) になってしまう。
    VITERBI_MODE_LATTICE_BIASPROB_BY_OCHAIRE 4.8e-3
    くらいで、ようやく「|構文|検査|」(|こうぶん|けんさ|)が 反映される様になった。

    以下、解析結果。
    
    学習無し:
    
    |こ(#U5)(SEG_DOUSHI_RENTAI)+う(DEP_RENTAI)|ぶんけん(#T30)(SEG_MEISHI_SHUTAN)+さ(DEP_END)|		7.156e-12 = 2.602e-03 * 2.750e-09 * 1.0e-00
    	|ぶんけん(SEG_MEISHI_SHUTAN)+さ(DEP_END)|{文末}|							1.0e-00 = pos:56, neg:0
    
    |こ(#U5)(SEG_DOUSHI_RENTAI)+う(DEP_RENTAI)|ぶんけん(#T30)(SEG_MEISHI_SHUTAN)+さ(DEP_EOS)|		7.156e-06 = 2.602e-03 * 2.750e-03 * 1.0e-00
    	|ぶんけん(SEG_MEISHI_SHUTAN)+さ(DEP_EOS)|{文末}|							1.0e-00 = pos:27, neg:0
    
    |こうぶん(#JN)(SEG_MEISHI_SHUTAN)(DEP_END)|けん(#T35)(SEG_MEISHI_SHUTAN)+さ(DEP_END)|			6.654e-12 = 2.420e-03 * 2.750e-09 * 1.0e-00
    	|けん(SEG_MEISHI_SHUTAN)+さ(DEP_END)|{文末}|								1.0e-00 = pos:56, neg:0
    
    |こうぶん(#JN)(SEG_MEISHI_SHUTAN)(DEP_END)|けん(#T35)(SEG_MEISHI_SHUTAN)+さ(DEP_EOS)|			6.654e-12 = 2.420e-03 * 2.750e-09 * 1.0e-00
    	|けん(SEG_MEISHI_SHUTAN)+さ(DEP_EOS)|{文末}|								1.0e-00 = pos:27, neg:0
    
    |こうぶん(#JN)(SEG_MEISHI_SHUTAN)(DEP_END)|けん(#JN)(SEG_MEISHI_SHUTAN)+さ(DEP_END)|			6.654e-12 = 2.420e-03 * 2.750e-09 * 1.0e-00
    
    |こうぶん(#JN)(SEG_MEISHI_SHUTAN)(DEP_END)|けん(#JN)(SEG_MEISHI_SHUTAN)+さ(DEP_EOS)|			6.654e-12 = 2.420e-03 * 2.750e-09 * 1.0e-00
    
    |こうぶん(#JN)(SEG_MEISHI_SHUTAN)(DEP_END)|けんさ(#T*)(SEG_MEISHI_SHUTAN)(DEP_END)|			6.654e-18 = 2.420e-03 * 2.750e-09 * 1.0e-06
    	|けんさ(SEG_MEISHI_SHUTAN)(DEP_END)|{文末}|								1.0e-06 = 該当無し
    
    |こうぶん(#JN)(SEG_MEISHI_SHUTAN)(DEP_END)|けんさ(#T30)(SEG_DOUSHI_RENYOU)(DEP_RENYOU)|			6.654e-18 = 2.420e-03 * 2.750e-09 * 1.0e-06
    	|けんさ(SEG_DOUSHI_RENYOU)(DEP_RENYOU)|{文末}|							1.0e-06 = 該当無し
    
    |こうぶん(#JN)(SEG_MEISHI_SHUTAN)(DEP_END)|けんさ(#T30)(SEG_MEISHI_SHUTAN)(DEP_END)|			6.654e-18 = 2.420e-03 * 2.750e-09 * 1.0e-06
    	|けんさ(SEG_MEISHI_SHUTAN)(DEP_END)|{文末}|								1.0e-06 = 該当無し
    
    |こうぶん(#JN)(SEG_MEISHI_SHUTAN)(DEP_END)|けんさ(#T35)(SEG_MEISHI_SHUTAN)(DEP_END)|			6.654e-18 = 2.420e-03 * 2.750e-09 * 1.0e-06
    	|けんさ(SEG_MEISHI_SHUTAN)(DEP_END)|{文末}|								1.0e-06 = 該当無し
    
    |こうぶん(#T*)(SEG_MEISHI_SHUTAN)(DEP_END)|けんさ(#T35)(SEG_MEISHI_SHUTAN)(DEP_END)|			6.654e-18 = 2.420e-03 * 2.750e-09 * 1.0e-06
    
    
    ここから学習有り:VITERBI_MODE_LATTICE_BIASPROB_BY_OCHAIRE	4.8e-03
    
    |こうぶん(#T*)(SEG_MEISHI_SHUTAN)(DEP_END)|けんさ(#T30)(SEG_MEISHI_SHUTAN)(DEP_END)|			7.267e-06 = 4.037e-00 * 1.800e-00 * 1.0e-06
    
    |こうぶん(#T*)(SEG_MEISHI_SHUTAN)(DEP_END)|けんさ(#T30)(SEG_DOUSHI_RENYOU)(DEP_RENYOU)|			7.267e-06 = 4.037e-00 * 1.800e-00 * 1.0e-06
    
    |こうぶん(#T*)(SEG_MEISHI_SHUTAN)(DEP_END)|けんさ(#T*)(SEG_MEISHI_SHUTAN)(DEP_END)|			7.267e-06 = 4.037e-00 * 1.800e-00 * 1.0e-06
    
    |こうぶん(#T35)(SEG_MEISHI_SHUTAN)(DEP_END)|けんさ(#T*)(SEG_MEISHI_SHUTAN)(DEP_END)|			7.267e-06 = 4.037e-00 * 1.800e-00 * 1.0e-06
    
    |こうぶん(#T*)(SEG_MEISHI_SHUTAN)(DEP_END)|けんさ(#T30)(SEG_MEISHI_SHUTAN)(DEP_END)|			1.110e-14 = 4.037e-00 * 2.750e-09 * 1.0e-06
    
    |こうぶん(#T*)(SEG_MEISHI_SHUTAN)(DEP_END)|けんさ(#T30)(SEG_DOUSHI_RENYOU)(DEP_RENYOU)|			1.110e-14 = 4.037e-00 * 2.750e-09 * 1.0e-06
    
    面倒になったので以下省略。
    
    
    |(SEG_DOUSHI_RENTAI)+う(DEP_RENTAI)|(#T30)(SEG_MEISHI_SHUTAN)|
    |(SEG_MEISHI_SHUTAN)+さ(DEP_EOS)|{文末}|
    の形が各々 2.750e-03 と 1.0e-00 と言う高確率を持っているのに、
    |(SEG_MEISHI_SHUTAN)(DEP_END)|{文末}|
    の形の確率が 1.0e-06(コーパス該当無し)しかないのが原因らしい。
    
    コーパスデータベースの内容だと
    |(SEG_DOUSHI_RENTAI)+う(DEP_RENTAI)|(#T30)(SEG_MEISHI_SHUTAN)|
    は
    {5, 24, 323, 547, 548, 549, 662, 0, 0, 0, 0, 0, 0, 0, 0, 1}
    にあたり、これにより pos:1, neg:0 で確率 100%らしい。
    
    このデータは、make update_params および make update_params2 まででは生成されず、
    2回目の make update_params2 で生成されている。
    例文の
    	|あの子に|会う|気は|まだ|ない|
    の
    	|会う|気は|
    の部分から
    indep_word hash=135100515 features=5,24,323,547,548,549,662 #T 気 き
    が生成されて、これにより pos:1, neg:0 になるらしい。
    
    make update_params および make update_params2 まででは、
    indep_word hash=135100515 features=5,25,161,547,548,549,662 #T 気 き
    になって該当しない。
    
    差異部分の意味は以下の通り。
    	24: DEP_RENTAI
    	323: SEG_DOUSHI_RENTAI → SEG_MEISHI_SHUTAN
    	25: DEP_END
    	161: SEG_DOUSHI_SHUTAN → SEG_MEISHI_SHUTAN
    

    Thu,12 Aug,2010 に続く。

    yahoo の分散サーバ。
    数ヶ月前に?、更新か何か有ったらしい。SSL証明書が変わっていた。 見つかった範囲では、
    l04.login.bbt.2010
    l05.login.bbt.2010
    l06.login.bbt.2010
    l07.login.bbt.2010
    l05.login.ogk.2010
    l06.login.ogk.2010
    l07.login.ogk.2010
    l08.login.ogk.2010
    l05.login.kks.2010
    l06.login.kks.2010
    l07.login.kks.2010
    l08.login.kks.2010
    l09.login.kks.2010
    l10.login.kks.2010
    l11.login.kks.2010
    の15台。

    Thu,12 Aug,2010

    Anthy 拙作パッチ。
    かな漢字変換 anthy で、個人用学習データを活用して変換結果の改善を目指すパッチ

    付属語が無い時の付属語ハッシュ値が一意に決まらない構造上のバグ発見。
    update_params 関連処理時はハッシュ値 0(データベース上では580)に なっているのに、 かな漢字変換処理時はハッシュ値 1023(データベース上では 1603)に なっていた。
    体言止めのコーパス確率がいつも該当無し(1.0e-06)になるわけだ……。
    原作版では、別の箇所の設計構造の影響で、 おそらく意図せずに、正常に動く状態になっていた。
    もう面倒になったので、場当たり的手法で対処。  testing 版のみ修正完了。 安定版は、作業が追いついていません。

    昨日の解析結果のやり直し結果。
    
    
    学習無し:
    
    |こうぶん(#JN)(SEG_MEISHI_SHUTAN)(DEP_END)|けんさ(#T*)(SEG_MEISHI_SHUTAN)(DEP_END)|			5.444e-06 = 2.420e-03 * 2.250e-03 * 1.0e-00
    	|けんさ(SEG_MEISHI_SHUTAN)(DEP_END)|{文末}|								1.0e-00 = pos:25188, neg:0
    
    |こうぶん(#JN)(SEG_MEISHI_SHUTAN)(DEP_END)|けんさ(#T30)(SEG_DOUSHI_RENYOU)(DEP_RENYOU)|			6.654e-12 = 2.420e-03 * 2.750e-09 * 1.0e-00
    
    |こうぶん(#JN)(SEG_MEISHI_SHUTAN)(DEP_END)|けんさ(#T30)(SEG_MEISHI_SHUTAN)(DEP_END)|			5.822e-06 = 2.420e-03 * 2.406e-03 * 1.0e-00
    
    |こうぶん(#JN)(SEG_MEISHI_SHUTAN)(DEP_END)|けんさ(#T35)(SEG_MEISHI_SHUTAN)(DEP_END)|			5.444e-06 = 2.420e-03 * 2.250e-03 * 1.0e-00
    
    |こうぶん(#T*)(SEG_MEISHI_SHUTAN)(DEP_END)|けんさ(#T35)(SEG_MEISHI_SHUTAN)(DEP_END)|			5.444e-06 = 2.420e-03 * 2.250e-03 * 1.0e-00
    
    
    ここから学習有り:VITERBI_MODE_LATTICE_BIASPROB_BY_OCHAIRE	3.0e-03
    
    |こうぶん(#T*)(SEG_MEISHI_SHUTAN)(DEP_END)|けんさ(#T30)(SEG_MEISHI_SHUTAN)(DEP_END)|			2.848e-00 = 2.523e-00 * 1.129e-00 * 1.0e-00
    
    |こうぶん(#T*)(SEG_MEISHI_SHUTAN)(DEP_END)|けんさ(#T30)(SEG_DOUSHI_RENYOU)(DEP_RENYOU)|			2.838e-00 = 2.523e-00 * 1.125e-00 * 1.0e-00
    
    面倒になったので以下省略。
    

    追記:
    parsed_data* を見て付属語ハッシュ値を確認してみましたが。 ハッシュ重複がかなり有りますね……。

    追記2:
    上記の「付属語が無い時の付属語ハッシュ値の計算」を 一意に決まる様に処理の省略をしたところ、 update_params の速度が倍になった。   謎。   そんなに速度が変わる様な所じゃないと思うのだけれどな……。

    Fri,13 Aug,2010

    Anthy 拙作パッチ。
    かな漢字変換 anthy で、個人用学習データを活用して、なんかもう思い付く事を何でもかんでも試してみて、変換結果の改善を目指すパッチ

    コーパスデータベースの構造に HID_IDI_IwDT モードを追加。

    IDIモードでは、
    第1区切り情報品詞クラス文頭→名詞+格助詞|品詞クラス名詞+格助詞品詞#T
    第2区切り情報品詞クラス名詞+格助詞→動詞+連体付属語クラス格助付属語ハッシュhash(を)|品詞クラス動詞+連体品詞#R5
    第3区切り情報品詞クラス動詞+連体→文末付属語クラス連体付属語ハッシュhash(る)|品詞クラス文末
    と言う構造になっています。
    
    さて、この構造だと、第1区切り情報の様に前文節に{文頭}が来た場合、
    付属語クラス付属語ハッシュ
    の記録領域が使われず余ります。ここに後文節の付属語情報を入れてしまう事で、
    文頭からつながる先頭文節を細かく分類する事ができる様になる筈です。
    
    また、第3区切り情報の様に後文節に{文末}が来た場合、
    品詞
    の記録領域が使われず余ります。ここに前文節の品詞情報を入れてしまう事で、
    文末につながる最後尾文節を細かく分類する事ができる様になる筈です。
    
    結果、こんな感じになります。
    第1区切り情報品詞クラス文頭→名詞+格助詞|品詞クラス名詞+格助詞品詞#T付属語クラス格助付属語ハッシュhash(を)
    第2区切り情報品詞クラス名詞+格助詞→動詞+連体付属語クラス格助付属語ハッシュhash(を)|品詞クラス動詞+連体品詞#R5
    第3区切り情報品詞クラス動詞+連体→文末品詞#R5付属語クラス連体付属語ハッシュhash(る)|品詞クラス文末
    
    で。
    で。
    で。
    先頭文節や最後尾文節の内容を細かく分類できる様になった所で、
    何か良い事が有るか否かは不明だったりします。
    

    Anthy のバグだか仕様だか。
    make update_params を1回行っただけでは、 コーパスデータベース corpus_info に FEATURE_WEAK_SEQ フラグ(549) が、 何故か記録されていない。
    ところが、かな漢字変換を行う際には 変換候補に対して FEATURE_WEAK_SEQ フラグも使用されるので、 結果、「コーパス corpus_info に該当無し」が連発してしまう。
    make update_params ; make update_params2 まで行うと、ようやくコーパスデータベース corpus_info に FEATURE_WEAK_SEQ フラグが出現してくる。
    make update_params ; make update_params2 は必須なのだろうか?


    たぶん。
    make update_params 時に生成した weak_words が FEATURE_WEAK_SEQ 該当一覧なのだけれども、 make update_params 時はまだ weak_words が完成していないから corpus_info から weak_words の FEATURE_WEAK_SEQ を探す事ができない。 だから make update_params しただけの時点の corpus_info には FEATURE_WEAK_SEQ フラグが存在しない。
    と言う事かな?

    Sat,14 Aug,2010

    Anthy 拙作パッチ。
    かな漢字変換 anthy で、個人用学習データを活用して変換結果の改善を目指すパッチ

    実験版(patch13-testing)から 安定版(patch13B-23-iconv-ucdict)へ、 バグ修正をバックポート(実験版では全て修正済です)。
    ……。
    が、1日では終わらなかったので、途中まで行った所で一旦中断して、 アップしておいた。

    以下、作業内容:

    Sun,15 Aug,2010

    Anthy 拙作パッチ。
    かな漢字変換 anthy で、個人用学習データを活用して変換結果の改善を目指すパッチ

    実験版(patch13-testing)から 安定版(patch13B-23-iconv-ucdict)への バグ修正のバックポート、 昨日1件残っていた分も完了。

    Anthy 拙作パッチ。
    バグ修正が出揃った所で動作確認を兼ねたベンチーマークテスト。

    Anthy 拙作パッチ ベンチマークテスト
    系列 モード 文節区切りの誤答数 文節区切り正答中の変換候補誤答数変換所要時間
    安定版(patch13B-iconv-ucdict)MBRビタビ 42 13 7.05 [秒]

    実験版(patch13-testing) MBRビタビ(IID) 46 10 7.32 [秒]
    実験版(patch13-testing) MBRビタビ(IDI) 31 23 7.00 [秒]
    実験版(patch13-testing) MBRビタビ(HID_IDI_IwDT) 36 16 7.08 [秒]

    実験版(patch13-testing) 前方3文節最長一致 31 16 1.77 [秒]
    実験版(patch13-testing) 前方10文節最長一致 30 20 33.13 [秒]

    実験版(patch13-testing) MBRビタビ(HID_IDI_IwDT)学習の再生を使用(1) 36 2 10.87 [秒]
    実験版(patch13-testing) MBRビタビ(HID_IDI_IwDT)学習の再生を使用(2)6 5 0 11.86 [秒]
    実験版(patch13-testing) 前方3文節最長一致 学習の再生を使用(2)1 0 0 4.56 [秒]

    Fri,03 Sep,2010に ベンチマークテストの改訂版が有ります。

    Anthy 拙作パッチ。
    MBRビタビモードにて、 「|床を|掃除しろ|」(|ゆかを|そうじしろ|)が、 いくら学習しても再生されず、 「|床を|総|辞しろ|」(|ゆかを|そう|じしろ|)になる。

    ゆか+を(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)(MW_OCHAIREwithoutDEP)	|そうじ+しろ(SEG_DOUSHI_SHUTAN)(DEP_END)(MW_OCHAIREwithoutDEP)				2.890e-06	※学習(3.0e-3)
    ゆか+を(SEG_MEISHI_RENYOU)(DEP_RENYOU)(MW_OCHAIREwithoutDEP)		|そうじ+しろ(SEG_DOUSHI_SHUTAN)(DEP_END)						7.057e-09
    ゆか+を(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)(MW_OCHAIREwithoutDEP)	|そうじ+しろ(SEG_DOUSHI_SHUTAN)(DEP_END)						5.640e-21
    ゆか+を(SEG_MEISHI_RENYOU)(DEP_RENYOU)(MW_OCHAIREwithoutDEP)		|そうじ+しろ(SEG_DOUSHI_SHUTAN)(DEP_END)						7.036e-09
    ゆか+を(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)(MW_OCHAIREwithoutDEP)	|そうじ+しろ(SEG_DOUSHI_SHUTAN)(DEP_END)						6.852e-09
    ゆか+を(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)(MW_OCHAIREwithoutDEP)	|そ+う(SEG_DOUSHI_RENTAI)(DEP_RENTAI)	|じ+しろ(SEG_DOUSHI_SHUTAN)(DEP_END)		1.928e-05	※提示
    ゆか+を(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)(MW_OCHAIREwithoutDEP)	|そう(SEG_MEISHI_SHUTAN)(DEP_END)	|じ+しろ(SEG_DOUSHI_SHUTAN)(DEP_END)		5.876e-06
    ゆか+を(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)(MW_OCHAIREwithoutDEP)	|そうじ(SEG_MEISHI_SHUTAN)(DEP_END)	|しろ(SEG_TANKANJI)(DEP_END)			8.099e-06
    ゆか+を(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)(MW_OCHAIREwithoutDEP)	|そうじ(SEG_DOUSHI_RENYOU)(DEP_RENYOU)	|しろ(SEG_TANKANJI)(DEP_END)			1.469e-05
    ゆか+を(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)(MW_OCHAIREwithoutDEP)	|そうじ(SEG_DOUSHI_RENYOU)(DEP_RENYOU)	|しろ(SEG_MEISHI_SHUTAN)(DEP_END)		1.469e-05
    ゆか+を(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)(MW_OCHAIREwithoutDEP)	|そうじ(SEG_DOUSHI_RENYOU)(DEP_RENYOU)	|しろ(SEG_MEISHI_SHUTAN)(DEP_END)		1.468e-05
    ゆか+を(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)(MW_OCHAIREwithoutDEP)	|そうじ(SEG_DOUSHI_RENYOU)(DEP_RENYOU)	|しろ(SEG_MEISHI_SHUTAN)(DEP_END)		1.468e-05
    ゆか+を(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)(MW_OCHAIREwithoutDEP)	|そうじ(SEG_DOUSHI_RENYOU)(DEP_RENYOU)	|しろ(SEG_MEISHI_SHUTAN)(DEP_END)		1.454e-05
    ゆか+を(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)(MW_OCHAIREwithoutDEP)	|そうじ(SEG_DOUSHI_RENYOU)(DEP_RENYOU)	|しろ(SEG_MEISHI_SHUTAN)(DEP_END)		1.454e-05
    ゆか+を(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)(MW_OCHAIREwithoutDEP)	|そうじ(SEG_DOUSHI_RENYOU)(DEP_RENYOU)	|しろ(SEG_MEISHI_SHUTAN)(DEP_END)		1.454e-05
    ゆか+を(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)(MW_OCHAIREwithoutDEP)	|そうじ(SEG_DOUSHI_RENYOU)(DEP_RENYOU)	|しろ(SEG_DOUSHI_SHUTAN)(DEP_END)		1.599e-05
    ゆか+を(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)(MW_OCHAIREwithoutDEP)	|そうじ(SEG_MEISHI_SHUTAN)(DEP_END)	|しろ(SEG_TANKANJI)(DEP_END)			8.019e-06
    ゆか+を(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)(MW_OCHAIREwithoutDEP)	|そうじ(SEG_DOUSHI_RENYOU)(DEP_RENYOU)	|しろ(SEG_TANKANJI)(DEP_END)			2.056e-06
    ゆか+を(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)(MW_OCHAIREwithoutDEP)	|そ+う(SEG_DOUSHI_RENTAI)(DEP_RENTAI)	|じし(SEG_MEISHI_SHUTAN)(DEP_END)	|ろ(SEG_TANKANJI)(DEP_END)	2.496e-09
    ゆか+を(SEG_MEISHI_RENYOU)(DEP_RENYOU)(MW_OCHAIREwithoutDEP)		|そう(SEG_DOUSHI_RENYOU)(DEP_RENYOU)	|じし(SEG_MEISHI_FUZOKUGO)(DEP_NONE)	|ろ(SEG_MEISHI_SHUTAN)(DEP_END)	4.336e-09
    ゆか+を(SEG_MEISHI_RENYOU)(DEP_RENYOU)(MW_OCHAIREwithoutDEP)		|そう(SEG_DOUSHI_RENYOU)(DEP_RENYOU)	|じし(SEG_MEISHI_FUZOKUGO)(DEP_NONE)	|ろ(SEG_MEISHI_SHUTAN)(DEP_END)	4.336e-09
    ゆか+を(SEG_MEISHI_RENYOU)(DEP_RENYOU)(MW_OCHAIREwithoutDEP)		|そう(SEG_DOUSHI_RENYOU)(DEP_RENYOU)	|じし(SEG_MEISHI_FUZOKUGO)(DEP_NONE)	|ろ(SEG_MEISHI_SHUTAN)(DEP_END)	4.023e-09
    (以下略)
    

    はい。
    学習に対するバイアス確率が1桁足りていません。

    VITERBI_MODE_LATTICE_BIASPROB_BY_OCHAIRE 3.0e-2
    指定すれば、
    
    ゆか+を(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)(MW_OCHAIREwithoutDEP)	|そうじ+しろ(SEG_DOUSHI_SHUTAN)(DEP_END)(MW_OCHAIREwithoutDEP)				2.875e-04	※学習(3.0e-2)
    学習が反映される様になりました。
    
    上記のベンチマーク「MBRビタビ(HID_IDI_IwDT)学習の再生を使用(2)」では、
    このパラメータ調整後の結果になっています。
    

    Anthy 拙作パッチ。
    MBRビタビモードでも前方n文節最長一致モードでもどちらでも、 「|何も|ない|ところの|」(|なにも|ない|ところの|)が、 いくら学習しても学習されず、 「|何も|ないと|頃の|」(|なにも|ないと|ころの|)になる。

    DONOT_LEARN_HIRAGANA H 指定していたのを忘れていた。
    自爆。

    明日に続く。

    Mon,16 Aug,2010

    Anthy 拙作パッチ。
    かな漢字変換 anthy で、個人用学習データを活用して変換結果の改善を目指すパッチ

    ENABLE_PREFIX_HISTORY 機能, ENABLE_SUFFIX_HISTORY 機能、追加。 接頭辞学習や接尾辞学習を無効にできます。
    一般ユーザには関係無い修正ですね。

    Mon,16 Aug,2010 〜 Wed,18 Aug,2010

    昨日の続き。

    Anthy 拙作パッチ。
    MBRビタビモードにて、 「|素手で|攻撃すべきだ|」(|すでで|こうげきすべきだ|)が、 いくら学習しても再生されず、 「|素手で|攻撃す|べきだ|」(|すでで|こうげきす|べきだ|)になる。

    すで+で(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)(MW_OCHAIRE)	|こうげき+すべきだ(SEG_DOUSHI_SHUTAN)(DEP_END)(MW_OCHAIRE)						7.731e-02※学習(3.0e-2)
    すで+で(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)(MW_OCHAIRE)	|こうげき+す(SEG_DOUSHI_SHUTAN)(DEP_END)(MW_OCHAIREwithoutDEP)	|べき+だ(SEG_MEISHI_SHUTAN)(DEP_END)	7.361e+01※学習(3.0e-2)
    

    結論:
    コーパスによる確率値と、学習によるデータを混合処理する、 VITERBI_MODE_METAWORD_EFFECTS_SENTENCE から VITERBI_MODE_LATTICE_BIASPROB_BY_OCHAIRE 辺りの 設計ミス。
    設計ミスにより確率値が 1.0 を越えてしまい、 文節数が増えれば増えるほど評価が高くなり、 学習した内容よりもさらに文節数を増やした変換候補が優先されてしまう。

    同一の問題:いくら学習しても、以下の様な変換を提示してしまう。
    (3 ((UL RV) "素手で" 0 9) ((UL) "攻撃す" 0 3) ((UL) "べきだ" 0 5))
    (3 ((UL RV) "幽霊の" 0 5) ((UL) "飼い犬は" 0 5) ((UL) "怒っているのでは" 0 8) ((UL) "ない" 0 11) ((UL) "。" 0 3) ((UL) "単に" 0 13) ((UL) "空腹な" 0 3) ((UL) "野田" 0 7))
    (3 ((UL RV) "忘れるな" 0 3) ((UL) "!" 0 2) ((UL) "大きな" 0 8) ((UL) "犬は" 0 12) ((UL) "小さい" 0 3) ((UL) "犬より" 0 10) ((UL) "ずっと" 0 3) ((UL) "殺しに" 0 4) ((UL) "食い" 0 13))
    (3 ((UL RV) "魔法を" 0 4) ((UL) "かけた" 0 13) ((UL) "歯で" 0 11) ((UL) "戦ってみた" 0 4) ((UL) "下位" 0 96))
    (3 ((UL RV) "攻撃を" 0 4) ((UL) "命中させたいのなら" 0 3) ((UL) "短剣を" 0 8) ((UL) "使い" 0 5) ((UL) "なさい" 0 2))
    
    

    対処法:
    MBRビタビモードでの文節区切り学習の再生関連部分である、 VITERBI_MODE_METAWORD_EFFECTS_SENTENCE と VITERBI_MODE_LATTICE_BIASPROB_BY_OCHAIRE の付近を、 再設計、実装しなおし、調整し直し。

    以下、再設計の際のパラメータ調整のメモ書き。
    
    ゆか+を(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)			|そうじ+しろ(SEG_DOUSHI_SHUTAN)(DEP_END)				8.284e-31 = 1.017e-06 * 8.148e-19 * 1.0e-06
    ゆか+を(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)			|そうじ+しろ(SEG_DOUSHI_SHUTAN)(DEP_END)				1.006e-18 = 1.017e-06 * 9.899e-07 * 1.0e-06
    ゆ+かを(SEG_MEISHI_RENYOU)(DEP_RENYOU)				|そうじ+しろ(SEG_DOUSHI_SHUTAN)(DEP_END)				1.037e-30 = 1.019e-12 * 1.018e-12 * 1.0e-06
    ゆか+を(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)	|そう(SEG_RENYOU_SHUSHOKU)(DEP_END)	|じ+しろ(SEG_DOUSHI_SHUTAN)(DEP_END)		9.026e-19 = 1.017e-06 * 9.528e-07 * 9.318e-07 * 1.0e-00
    ゆか+を(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)	|そ+う(SEG_DOUSHI_RENTAI)(DEP_RENTAI)	|じ+しろ(SEG_DOUSHI_SHUTAN)(DEP_END)		1.020e-18 = 1.017e-06 * 9.852e-07 * 1.018e-06 * 1.0e-00	※提示
    ゆか+を(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)	|そうじ(SEG_DOUSHI_RENYOU)(DEP_RENYOU)	|しろ(SEG_MEISHI_SHUTAN)(DEP_END)		7.883e-19 = 1.017e-06 * 8.613e-07 * 9.002e-07 * 1.0e-00
    ゆか+を(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)	|そうじ(SEG_DOUSHI_RENYOU)(DEP_RENYOU)	|しろ(SEG_DOUSHI_SHUTAN)(DEP_END)		8.667e-19 = 1.017e-06 * 8.613e-07 * 9.898e-07 * 1.0e-00
    ゆか+を(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)	|そうじ(SEG_MEISHI_SHUTAN)(DEP_END)	|しろ(SEG_TANKANJI)(DEP_END)			4.347e-19 = 1.017e-06 * 8.256e-07 * 5.179e-07 * 1.0e-00
    
    ゆか+を(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)(MW_OCHAIRE)	|そうじ+しろ(SEG_DOUSHI_SHUTAN)(DEP_END)(MW_OCHAIREwithoutDEP)		1.426e-18 = 1.365e-06 * 1.045e-06 * 1.0e-06	学習1.0e-30
    ゆか+を(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)(MW_OCHAIRE)	|そうじ+しろ(SEG_DOUSHI_SHUTAN)(DEP_END)(MW_OCHAIRE)			1.899e-18 = 1.365e-06 * 1.392e-06 * 1.0e-06	学習1.0e-30
    
    すで+で(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)	|こうげき+すべきだ(SEG_DOUSHI_SHUTAN)(DEP_END)						8.847e-19 = 8.862e-07 * 9.983e-07 * 1.0e-06	※提示
    すで+で(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)	|こう(SEG_RENYOU_SHUSHOKU)(DEP_RENYOU)	|げき+すべきだ(SEG_DOUSHI_SHUTAN)(DEP_END)	8.274e-19 = 8.862e-07 * 9.167e-07 * 1.018e-06 * 1.0e-00
    
    すで+で(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)(MW_OCHAIRE)	|こうげき+すべきだ(SEG_DOUSHI_SHUTAN)(DEP_END)(MW_OCHAIREwithoutDEP)	1.246e-18 = 1.185e-06 * 1.052e-06 * 1.0e-06	学習1.0e-30
    すで+で(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)(MW_OCHAIRE)	|こうげき+すべきだ(SEG_DOUSHI_SHUTAN)(DEP_END)(MW_OCHAIRE)		1.661e-18 = 1.185e-06 * 1.402e-06 * 1.0e-06	学習1.0e-30
    
    ちゅうい(SEG_MEISHI_SHUTAN)(DEP_END)	|しろ(SEG_MEISHI_SHUTAN)(DEP_END)	|!(SEG_TANKANJI)(DEP_END)				2.378e-20 = 7.101e-07 * 6.565e-07 * 5.102e-08 * 1.0e-00
    ちゅうい+しろ(SEG_DOUSHI_SHUTAN)(DEP_END)(MW_OCHAIREwithoutDEP)	|!(SEG_HEAD)(DEP_NONE)(MW_OCHAIREwithoutDEP)				5.801e-31 = 1.354e-12 * 4.286e-13 * 1.0e-06	学習1.0e-30
    ちゅうい+しろ(SEG_DOUSHI_SHUTAN)(DEP_END)(MW_OCHAIREwithoutDEP)	|!(SEG_HEAD)(DEP_NONE)(MW_OCHAIREwithoutDEP)				2.391e-20 = 1.958e-07 * 1.100e-07 * 1.110e-06	学習4.4e-7
    
    (3 ((UL RV) "魔除けを" 0 5) ((UL) "作り出すことは" 0 10) ((UL) "困難だ" 0 23) ((UL) "。" 0 3) ((UL) "例え寝甲斐の" 0 18) ((UL) "杖を" 0 5) ((UL) "もって" 0 12) ((UL) "しても" 0 7))			VITERBI_MODE_LATTICE_BIASPROB_BY_OCHAIRE 1.6e-3
    (3 ((UL RV) "魔除けを" 0 5) ((UL) "作り出すことは" 0 10) ((UL) "困難だ" 0 23) ((UL) "。" 0 3) ((UL) "たとえ" 0 10) ((UL) "願いの" 0 8) ((UL) "杖を" 0 5) ((UL) "もって" 0 12) ((UL) "しても" 0 7))	VITERBI_MODE_LATTICE_BIASPROB_BY_OCHAIRE 1.7e-3
    
    
    新設計にしても、
    VITERBI_MODE_LATTICE_BIASPROB_BY_OCHAIRE 1.0e-0
    anthy_settings.anthy_mode.lattice.biasprob_by_ochaire = 1.0e-0
    にもかかわらず、
    (3 ((UL RV) "鎧は" 0 6) ((UL) "錆びない" 0 4) ((UL) "ように" 0 19) ((UL) "して" 0 7) ((UL) "おけ" 0 9))
    が再生できない。
    → MW_OCHAIREwithoutDEP が設計想定以上に有効に機能してしまい、学習した内容よりも長く付属語を連結してしまっている。
    
    →→ MW_OCHAIRE* による確率バイアスのバランス調整が必要。
    
    MW_OCHAIRE が 0.80、MW_OCHAIREwithoutDEP が 0.40 の場合:
    ※	"鎧は":0.80	"錆びない":0.64				"ように":0.51	"して":0.41	"おけ":0.33
    	"鎧は":0.80	"錆びない""ように":0.32			"して":0.26	"おけ":0.20
    	"鎧は":0.80	"錆びない""ように""して":0.32		"おけ":0.26
    	"鎧は":0.80	"錆びない""ように""して""おけ":0.32
    
    ※	"鎧は":0.80	"錆びないように":0.64			"して":0.51	"おけ":0.41
    	"鎧は":0.80	"錆びないように""して":0.32		"おけ":0.26
    	"鎧は":0.80	"錆びないように""して""おけ":0.32
    
    MW_OCHAIRE が 0.80、MW_OCHAIREwithoutDEP が 0.50 の場合:
    	"鎧は":0.80	"錆びない":0.64				"ように":0.51	"して":0.41	"おけ":0.33
    	"鎧は":0.80	"錆びない""ように":0.40			"して":0.32	"おけ":0.26
    	"鎧は":0.80	"錆びない""ように""して":0.40		"おけ":0.32
    ※	"鎧は":0.80	"錆びない""ように""して""おけ":0.40
    
    よろい+は(SEG_MEISHI_SHUTAN)(DEP_END)		|さび+ないようにしておけ(SEG_DOUSHI_SHUTAN)(DEP_END)											8.270e-19 = 9.780e-07 * 8.456e-07 * 1.0e-6
    よろい+は(SEG_MEISHI_SHUTAN)(DEP_END)(MW_OCHAIRE)	|さび+ない(SEG_DOUSHI_SHUTAN)(DEP_END)(MW_OCHAIRE)	|よう+に(SEG_MEISHI_KAKUJOSHI)(DEP_KAKUJOSHI)(MW_OCHAIRE)	|し+て(SEG_DOUSHI_RENTAI)(DEP_RENTAI)(MW_OCHAIRE)	|お+け(SEG_DOUSHI_SHUTAN)(DEP_END)(MW_OCHAIRE)		4.032e-02 = 4.752e-01 * 5.280e-01 * 5.280e-01 * 5.764e-01 * 5.280e-01 * 1.0e-0	学習6.6e-1
    
    (3 ((UL RV) "目の" 0 8) ((UL) "見えなく" 0 3) ((UL) "なる" 0 6) ((UL) "薬は" 0 4) ((UL) "見えない" 0 3) ((UL) "ものを" 0 7) ((UL) "見える" 0 3) ((UL) "ように" 0 19) ((UL) "する" 0 10))	学習5.9e-1
    

    Tue,17 Aug,2010

    クレジットカードの引き落とし月。
    クレジットカードを使ってから10日経っても クレジットカード会社に情報が上がっていない事が、 割とザラに有るらしい。
    当月の締め日までに情報が上がらず翌月での勘定に回ってしまい、 引き落とし月が想定とずれまくる事が何度も……。

    Wed,18 Aug,2010

    Anthy 拙作パッチ。
    かな漢字変換 anthy で、個人用学習データを活用して変換結果の改善を目指すパッチ

    昨日の続き。
    実験版(patch13-testing) にて、 MBRビタビモードにおける文節区切り学習の再生機能を (何度目かの)再設計、実装し直し。
    設計の方向性は前回の再設計と同じですが、 コーパスと学習の各々の確率値を算出混合する部分を丸ごと書き直したので、 ちゃんと動作するか否か、自信がありません。

    残りの問題:
    「ちゅういしろ」を変換すると、
    ((UL RV) "注意" 0 26) ((UL) "城" 0 6)
    と、分離してしまい、1文節に連結した状態を学習させる事ができない。
    → OCHAIRE1 機能を実装予定。
    # EXPANDPAIR は学習を忘れる学習ができない欠点が。

    んで。
    実験版(patch13-testing) にて OCHAIRE1 実装完了。 実際に使ってみて様子見中。

    「|様子見|中|」(|ようすみ|ちゅう|)を覚えた後に、 「ちゅういしろ」とタイプすると、 「|中|いしろ」(|ちゅう|いしろ|)になってしまう。
    単純に、学習した OCHAIRE1 をそのまま再生するだけでは駄目な模様。

    明日に続く。

    Thu,19 Aug,2010

    Anthy 拙作パッチ。
    かな漢字変換 anthy で、個人用学習データを活用して変換結果の改善を目指すパッチ

    昨日の続き。
    実験版(patch13-testing) にて。
    OCHAIRE1 学習を適用すると、入力された内容が1文節になる場合のみ、 学習を適用する様に変更。

    例えば、 OCHAIRE1 にて「|中|」(|ちゅう|)を学習してある状態で 「ちゅういしろ」を変換した場合、 学習を適用すると 「|中|いしろ|」(|ちゅう|いしろ|)と1文節にならない為、 OCHAIRE1 の「|中|」(|ちゅう|)は無視します。
    同じく、 OCHAIRE1 にて「|中|」(|ちゅう|)を学習してある状態で 「ちゅう」を変換した場合、 学習を適用すると 「|中|」(|ちゅう|)と1文節になる為、 OCHAIRE1 の「|中|」(|ちゅう|)を適用します。


    これで様子を見て、問題が無い様ならば、

    を、安定版(patch13B-23-iconv-ucdict)へバックポート予定。
    MBRビタビモードにおけるデータベースのモード、 IDIモード、HID_IDI_IwDTモードを、 何時、安定版にバックポートするかは悩み中。

    さっきやっていた CM。
    「8色に変化する LED 電球」
    7色なら判るけれど8色って、あと1色は何色だろう?

    1色多いのは橙色らしい。

    Fri,20 Aug,2010

    sb-ssl.google.com:443 の証明書が更新になっていた。 古い方の期限は 2010/05/24〜2011/05/24 で、まだたっぷり余裕があるのに……。 新しい方の期限は 2010/08/05〜2011/08/05 だった。

    Anthy 拙作パッチ。
    かな漢字変換 anthy で、個人用学習データを活用して変換結果の改善を目指すパッチ

    昨日の続き。
    実験版(patch13-testing) にて。
    文節を区切らない学習に、 ENABLE_OCHAIRE1_WITHOUT_DEP機能追加。
    学習反映時に付属語を自動類推します。

    例えば、 OCHAIRE1 にて「|中|」(|ちゅう|)を学習してある状態で 「ちゅういしろ」を変換した場合、 「いしろ」と言う付属語は存在しないので、 OCHAIRE1 の「|中|」(|ちゅう|)は無視します。
    同じく、 OCHAIRE1 にて「|中|」(|ちゅう|)を学習してある状態で 「ちゅうに」を変換した場合、 「に」と言う付属語が存在するので、 OCHAIRE1 の「|中|」(|ちゅう|)を適用して、 「|中に|」(|ちゅうに|)となります。

    Sun,22 Aug,2010

    SVN::Web を日本語対応にするパッチ」 修正。
    Blame/Annotate 表示で日本語処理がこける問題を修正。

    AMD系の新品ノートPC。
    Sempron や MV-40 から AMD V120 とか K125 に、 移行しているっぽい。

    Wed,25 Aug,2010

    svn のタイムスタンプ。
    さっき気付いたのだけれども。
    ファイルの内容が変化していても、 ファイルのサイズとタイムスタンプが変化していなければ、 svn st や svn co での操作対象から外されるらしい。
    use-commit-times = yes で作業している場合、このルールで除外されてしまう事があって、 案外面倒。

    svn のリビジョン管理。
    作業中の hoge.test があって、 その .svn/dir-prop-base が
    hoge.old:9
    の状態で、 svn merge -r 9:158 hoge.new とやったら、 .svn/dir-props が
    hoge.old:9-145
    hoge.new:146-158
    となった。なんじゃこりゃ?。 r145 や r146 には何にも無いごく普通の commit なのだけれど……。
    svn cp hoge.old hoge.new
    したのは r158 だし……。

    複数ファイルの内容の一括置換。
    find . -name "*" -exec gsed -i 's?^/anthy-core/branches/anthy-9100e.patch4:32-56?/anthy-core/branches/anthy-9100e.patch4:34-56?' {} \;
    GNU版 sed が必要。OpenBSD版 sed だと -i オプションが無い。

    PRINCESS PRINCESS、世界でいちばん熱い夏、1987.7.16。

    夢をあきらめないで、岡村孝子、1987.2.4。

    Thu,26 Aug,2010

    svn のレポジトリブラウザ。
    SVN::WEB も viewvc も、どちらも、 merge 情報(svn:mergeinfo)を表示する機能は無いのね……。
    tkcvs は merge 情報の表示機能が有るけれど web ベースからは使えないし。
    svn log -vg は、見られた物ではないし。

    って言った端から、 tkcvs も subcommander1 も Branch Diagram の解析しくじってるし……。

    Fri,27 Aug,2010

    Anthy 拙作パッチ。
    かな漢字変換 anthy で、個人用学習データを活用して変換結果の改善を目指すパッチ

    Sat,21 Aug,2010からずっと、 svn レポジトリの修復作業をチマチマやっていて、 ようやく終わった。

    第1段階:
    src-splitter/lattice.c での、 本来は複数回のコミットに分解すべきところを コミット1回にしてしまっていた箇所を、 過去に遡ってコミット複数回分に分解。

    第2段階その1:
    AUTHORS.patch での著作権者の記入漏れを過去に遡って記述。

    第2段階その2:
    src-splitter/lattice.c でのインデントの間違い (vimdiff モードで何かの操作をすると、再インデントになってしまうらしい) を、過去に遡って強制修正。

    第3段階:
    svn:mergeinfo の全領域に渡る大修正。

    uim-1.6.0
    FreeBSD の ports に来ないよ〜。 と言う訳で uim-1.6.0 を試せません……。 NetBSD も OpenBSD も来てないし……。

    Sat,28 Aug,2010

    そう遠くない所で、花火大会があった。 事前に知っていて、開始時間に合わせて会場に向かったものの、 事もあろうに会場となる橋を間違え、30〜45分近いタイムロス。 ほとんど見る事ができなかった。

    Sun,29 Aug,2010

    Eneloop
    Eneloop Lite とか言うのが出ていたらしい。
    単三 2個、950mAh, 2000回、¥780-、量販店価格¥580+10%ポイント。
    従来版は 単三 2個、1900mAh, 1500回、¥1,155-、量販店価格¥780+10%ポイント。
    総エネルギー価格比は、 従来版 3654mAh/円、Lite が 3276mAh/円。
    エネルギーの無駄な損失が無いと仮定すると、 従来版の方が 1.1倍くらいお得らしい。 実際の所、リモコンやマウスみたいな低消費電力の物だと、 従来版は無駄な損失が出やすいから、一概には言えないけれど。
    Eneloop Lite で 950mAh らしいけれど、 一昔だか二昔だかもっとだか前の NiCd って そのくらいの容量だった気がする。
    ……家の物置に有った 30年近く前らしい物は 450mAh だった……。

    陣内大蔵、空よ、1991.9.1。 刑事貴族2 後期エンディング。 ブレーキかけ忘れた車を水谷豊が追いかけるヤツ。

    Mon,30 Aug,2010

    杉ちゃん&鉄平、序曲「暴れん坊将軍」〜ロッシーニに捧ぐ〜、2010.7.28。 思わずウケてしまった……。

    subversion。
    FreeBSD には、何故か p5-SVN (SVN::Core) パッケージが存在しない。 OpenBSD には存在するのに……。

    Anthy 拙作パッチ。
    AUTHORS.patch の内容を、こちら webサイト側に掃き出す事にした。

    Thu,02 Sep,2010

    篠原涼子、恋しさと せつなさと 心強さと、1994.7.21

    Fri,03 Sep,2010

    Anthy 拙作パッチ。
    AUTHORS.patch の内容を、こちら webサイト側への掃き出し完了。
    ただ、もう、モチベーションだだ下がり。

    Anthy 拙作パッチ。
    かな漢字変換 anthy で、個人用学習データを活用して変換結果の改善を目指すパッチ

    そんな訳で、更新する必要はほとんど無いでしょう。

    Anthy 拙作パッチ。

    暫く(大分?)前から思い付いていた事を試してみるテスト。
    さて、結果は良い方に転がるでしょうか、悪い方に転がるでしょうか。

    入力した内容は、JNetHack の占いクッキーの内容を100件。

    かな漢字変換ソフトの変換結果ベンチマークテスト
    系列 モード 文節区切りの誤答数 文節区切り正答中の変換候補誤答数変換所要時間

    sj3-2.0.1.23 単語登録前 42 26 0.08 [秒]
    sj3-2.0.1.23 単語登録後 12 39 0.05 [秒]

    原作版 anthy-9100h MBRビタビ、コーパス無し 27 18 1.37 [秒]
    原作版 anthy-9100h MBRビタビ 25 15 1.49 [秒]
    原作版 anthy-9100h MBRビタビ BUCKET_SIZE=32768 19 18 1.54 [秒]

    原作版 anthy-9100h+alt-depgraph-100120MBRビタビ、コーパス無し 30 22 1.49 [秒]
    原作版 anthy-9100h+alt-depgraph-100120MBRビタビ 18 23 1.71 [秒]
    原作版 anthy-9100h+alt-depgraph-100120MBRビタビ BUCKET_SIZE=32768 10 31 1.75 [秒]

    実験版(patch13-testing) 前方3文節最長一致 31 15 1.76 [秒]

    実験版(patch13-testing) MBRビタビ、コーパス無し 27 19 6.30 [秒]
    実験版(patch13-testing) MBRビタビ(IID) ノーマル 25 17 6.75 [秒]
    実験版(patch13-testing) MBRビタビ(IDI) ノーマル 19 27 6.87 [秒]
    実験版(patch13-testing) MBRビタビ(HID_IDI_IwDT) ノーマル 19 23 6.91 [秒]

    実験版(patch13-testing) MBRビタビ(IID) corpus.?g.txt削除 19 17 6.90 [秒]
    実験版(patch13-testing) MBRビタビ(IDI) corpus.?g.txt削除 19 18 6.99 [秒]
    実験版(patch13-testing) MBRビタビ(HID_IDI_IwDT) corpus.?g.txt削除 19 20 6.81 [秒]

    実験版(patch13-testing) MBRビタビ(IID) 改造版 Magic 1:2 20 16 6.65 [秒]
    実験版(patch13-testing) MBRビタビ(IDI) 改造版 Magic 1:2 13 22 6.71 [秒]
    実験版(patch13-testing) MBRビタビ(HID_IDI_IwDT) 改造版 Magic 1:2 17 18 6.78 [秒]

    実験版(patch13-testing) MBRビタビ(IID) 改造版 Magic 3:4 17 19 6.67 [秒]
    実験版(patch13-testing) MBRビタビ(IDI) 改造版 Magic 3:4 13 22 6.87 [秒]
    実験版(patch13-testing) MBRビタビ(HID_IDI_IwDT) 改造版 Magic 3:4 14 19 6.89 [秒]

    実験版(patch13-testing) MBRビタビ(IID) 改造版 Magic 3:4 corpus.?g.txt削除 14 19 6.67 [秒]
    実験版(patch13-testing) MBRビタビ(IDI) 改造版 Magic 3:4 corpus.?g.txt削除 13 20 6.71 [秒]
    実験版(patch13-testing) MBRビタビ(HID_IDI_IwDT) 改造版 Magic 3:4 corpus.?g.txt削除 15 19 6.83 [秒]

    安定版(patch13-release-2010915)MBRビタビ、コーパス無し 31 19 6.10 [秒]
    安定版(patch13-release-2010915)MBRビタビ(HID_IDI_IwDT) Magic 3:4 14 20 6.60 [秒]
    安定版(patch13-release-2010915)MBRビタビ(HID_IDI_IwDT) Magic 3:4 学習の再生を使用 0 0 11.42 [秒]

    anthy-9100h-20100923ut デフォルトモード(前方3文節最長一致) 28 32 2.19 [秒]

    実験版(patch13-testing-2010927)MBRビタビ、コーパス無し 31 20 4.89 [秒]
    実験版(patch13-testing-2010927)MBRビタビ(IID) Magic 3:4 17 18 5.28 [秒]
    実験版(patch13-testing-2010927)MBRビタビ(IID) Magic 3:4 BUCKET_SIZE=32768 13 21 5.30 [秒]
    実験版(patch13-testing-2010927)MBRビタビ(IDI) Magic 3:4 8 24 5.26 [秒]
    実験版(patch13-testing-2010927)MBRビタビ(IDI) Magic 3:4 BUCKET_SIZE=32768 9 25 5.39 [秒]
    実験版(patch13-testing-2010927)MBRビタビ(HID_IDI_IwDT) Magic 3:4 14 20 5.29 [秒]
    実験版(patch13-testing-2010927)MBRビタビ(HID_IDI_IwDT) Magic 3:4 BUCKET_SIZE=32768 9 28 5.42 [秒]
    実験版(patch13-testing-2010927)MBRビタビ(HID_IDI_IwDT) Magic 3:4 学習の再生を使用 0 0 6.59 [秒]

    何をやったかと言うと。
    コーパス例文パターンのうち、出現回数の少ない物の 文節区切りへの利用確率を下げてみただけなんですがね。

    原作版(ノーマル)の場合、
    全例文中に正答1回しか出てこない例文パターンの場合の利用確率は 100%に、
    全例文中に正答100回出てくる例文パターンの場合の利用確率も 100%に、
    全例文中に正答7回と誤答3回出てくる例文パターンの場合の利用確率は 70%に、
    全例文中に正答70回と誤答30回出てくる例文パターンの場合の利用確率は 70%に、
    なります。
    「Magic 1:2」の場合、 全例文中に正答1回しか出てこない例文パターンの場合は利用確率を 66%に、 全例文中に正答100回出てくる例文パターンの場合は利用確率を 99%に、 全例文中に正答7回と誤答3回出てくる例文パターンの場合の利用確率は 66%に、 全例文中に正答70回と誤答30回出てくる例文パターンの場合の利用確率は 70%に、 変化させます。
    「Magic 3:4」の場合、 全例文中に正答1回しか出てこない例文パターンの場合は利用確率を 80%に、 全例文中に正答100回出てくる例文パターンの場合は利用確率を 99%に、 全例文中に正答7回と誤答3回出てくる例文パターンの場合の利用確率は 70%に、 全例文中に正答70回と誤答30回出てくる例文パターンの場合の利用確率は 70%に、 変化させます。
    さて、これを実行に移して良いものかどうか……。
    また、マジックナンバーは幾つ位にしたら良いものか……。

    Fri,17 Sep,2010 追記:
    sj3 での変換結果を追加。
    単語登録と言うのは、「ニンフ」とか「ユニコーン」とか、 そう言った JNetHack 特有の単語。

    bucket size の話は、 Sat,27 Nov,2010に続く。

    Anthy 拙作パッチのレポジトリ。
    src-ordering/infosort.c に、 Fri,27 Aug,2010 の「第2段階その2」と同じ編集ミスを発見 orz
    インデントがずれてる……。

    Sat,04 Sep,2010

    ハードオフで中古 Lenovo G560 が¥60,000- だった。
    ヨドバシカメラの web で確認してみたら、
    Core i3 2.26GHz 2GB, 320GB, DVDスーパーマルチ ¥59,800-(15%)
    Pentium DualCore 1.86GH 2GB, 250GB, DVDスーパーマルチ ¥59,800-(10%)
    Core i5 2.4GHz 2GB, 500GB, DVDスーパーマルチ ¥69,800-(17%)
    新品の方が安いし……。

    ようやく、 「ガンダム TVシリーズ エンディングテーマ コレクション」 を入手。¥500-だった。

    Sun,05 Sep,2010

    ノートPC。
    13inchディスプレイで 2GHz 以上、となると、ほとんど無いねぇ。 しかも7〜8万円くらいするし……。 シングルコアでいいのだけれどデュアルコアばっかりだし……。
    かえって 15inch の方が4〜6万円と、安いし……。 でもメモリ増設すると同じ位の値段になってしまうのか……。

    自転車で走っていたら、 自転車の防犯登録の一斉点検に引っかかった。 もうそんな季節か……。

    Mon,06 Sep,2010

    svnadmin。
    limit を
    limit datasize 256M
    にして svnadmin dump していたら、 Out of memory で abort してしまった。
    datasize の limit を引き上げて実行した所、 結局、svnadmin は 264MiB くらい消費していた。

    lzma / xz 。
    こいつもメモリ大食らいで、 lzma -9 したら 676MiB 消費していた。

    Firefox 3.6.x。
    これも limit datasize 384M していたら
    terminate called after throwing an instance of 'St9bad_alloc'
    what(): St9bad_alloc
    Abort trap
    で落ちた。

    OpenBSD の場合、/etc/login.conf で上限と標準値を設定して、
    % sudo cap_mkdb /etc/login.conf
    して、完全にログアウトしてからログインしなおせば、 新しい設定が有効になる。

    FreeBSD の場合、/boot/loader.conf で kern.maxdsiz="1G"
    とか指定する。 無茶な指定をするとカーネルが死ぬので注意。

    BUMP OF CHICKEN、天体観測、2001.3.14。

    Tue,07 Sep,2010

    Anthy 拙作パッチのレポジトリ。
    src-ordering/infosort.c の編集ミス潰し、 やっと完了。

    Wed,08 Sep,2010

    Anthy 拙作パッチのレポジトリ。
    実験版の名称の typo 修正完了。

    渡辺美里、My Revolution、1986.1.22。

    Thu,09 Sep,2010

    long double。
    long double は存在するけれども中身は double と同じ、 と言う処理系も有るのね……。

    shell script の test。
    括弧ってどうやって使うのかわからなかった。
    普通に使おうとすると
    Syntax error: word unexpected (expecting ")")
    とかエラーになってしまう。
    結局。
    \( とか \) とかのようにエスケープして使うらしい。
    括弧をネストする場合は、括弧間にスペースを入れないと駄目らしい。 argv[] 1つにつき括弧1つ、と言う事らしい。

    Fri,10 Sep,2010

    Anthy 拙作パッチ。
    かな漢字変換 anthy で、個人用学習データを活用して、なんかもう思い付く事を何でもかんでも試してみて、変換結果の改善を目指すパッチ

    更新するべきかどうかは微妙な所。

    Mon,13 Sep,2010

    銀行の預金金利が下がってる……。

    ~/.tcshrc 用の svn/svnadmin の追加設定を書いてみた。
    第1引数に応じてオプション指定も変更しようと書いてみたら、
    ファイル/ディレクトリ名補完が効かなくなって駄目だった。
    
        complete svn	'p/1/( add \
    			blame praise annotate ann \
    			cat \
    			changelist cl \
    			checkout co \
    			cleanup \
    			commit ci \
    			copy cp \
    			delete del remove rm \
    			diff di \
    			export \
    			help ? h \
    			import \
    			info \
    			list ls \
    			lock \
    			log \
    			merge \
    			mergeinfo \
    			mkdir \
    			move mv rename ren \
    			propdel pdel pd \
    			propedit pedit pe \
    			propget pget pg \
    			proplist plist pl \
    			propset pset ps \
    			resolve \
    			resolved \
    			revert \
    			status stat st \
    			switch sw \
    			unlock \
    			update up )/' \
    			'n/help/( add \
    			blame praise annotate ann \
    			cat \
    			changelist cl \
    			checkout co \
    			cleanup \
    			commit ci \
    			copy cp \
    			delete del remove rm \
    			diff di \
    			export \
    			help ? h \
    			import \
    			info \
    			list ls \
    			lock \
    			log \
    			merge \
    			mergeinfo \
    			mkdir \
    			move mv rename ren \
    			propdel pdel pd \
    			propedit pedit pe \
    			propget pget pg \
    			proplist plist pl \
    			propset pset ps \
    			resolve \
    			resolved \
    			revert \
    			status stat st \
    			switch sw \
    			unlock \
    			update up )/' \
    			'n/--targets/f/' \
    			'n/--depth/(empty files immediates infinity)/' \
    			'n/-r/(HEAD BASE COMMITTED PREV)/' \
    			'n/--revision/(HEAD BASE COMMITTED PREV)/' \
    			'n/-x/(-u --unified -b --ignore-space-change \
    			-w --ignore-all-space --ignore-eol-style \
    			-p --show-c-function)/' \
    			'n/--extensions/(-u --unified -b --ignore-space-change \
    			-w --ignore-all-space --ignore-eol-style \
    			-p --show-c-function)/' \
    			'n/--username/u/' \
    			'n/--config-dir/d/' \
    			'n/--diff3-cmd/c/' \
    			'n/-F/f/' \
    			'n/--file/f/' \
    			'n/--editor-cmd/c/' \
    			'n/--diff-cmd/c/' \
    			'n/--native-eol/(LF CR CRLF)/' \
    			'n/--accept/( \
    			postpone base mine-conflict \
    			theirs-conflict mine-full theirs-full \
    			edit launch \
    			base working mine-conflict \
    			theirs-conflict mine-full theirs-full)/' \
    			'n/--show-revs/(merged eligible)/' \
    			'n/--set-depth/(exclude empty files immediates infinity)/' \
    			'c/-/( -targets -depth \
    			q -quiet \
    			-force -no-ignore -auto-props -no-auto-props -parents \
    			r -revision v -verbose g -use-merge-history \
    			-incremental -xml \
    			x -extensions -force R -recursive \
    			-remove -changelist -cl \
    			-ignore-externals -diff3-cmd -no-unlock \
    			m -message F -file \
    			-force-log -editor-cmd \
    			-with-revprop -keep-changelists \
    			-encoding -keep-local \
    			c -change -old -new -diff-cmd \
    			-nodiff-deleted -notice-ancestry -summarize -native-eol \
    			-stop-on-copy l -limit \
    			-with-all-revprops -with-no-revprops \
    			-dry-run -record-only -ignore-ancestry \
    			-accept -reintegrate -show-revs -revprop -strict \
    			u -show-updates N -non-recursive \
    			-set-depth -relocate \
    			-username -password -no-auth-cache \
    			-non-interactive -trust-server-cert \
    			-config-dir -config-option )/' \
    			'p/2-/f/' \
    			'p/2-/d/'
        complete svnadmin	'p/1/( crashtest create deltify dump help ? h \
    			hotcopy list-dblogs list-unused-dblogs \
    			load lslocks lstxns pack recover \
    			rmlocks rmtxns setlog setrevprop setuuid \
    			upgrade verify )/' \
    			'n/help/( crashtest create deltify dump \
    			hotcopy list-dblogs list-unused-dblogs \
    			load lslocks lstxns pack recover \
    			rmlocks rmtxns setlog setrevprop setuuid \
    			upgrade verify )/' \
    			'n/h/( crashtest create deltify dump \
    			hotcopy list-dblogs list-unused-dblogs \
    			load lslocks lstxns pack recover \
    			rmlocks rmtxns setlog setrevprop setuuid \
    			upgrade verify )/' \
    			'n/--config-dir/d/' \
    			'n/--fs-type/(fsfs bdb)/' \
    			'n/--parent-dir/d/' \
    			'c/-/( -bdb-txn-nosync -bdb-log-keep \
    			-config-dir -fs-type \
    			-pre-1.4-compatible -pre-1.5-compatible -pre-1.6-compatible \
    			r -revision q -quiet \
    			-incremental -deltas \
    			-clean-logs \
    			-ignore-uuid -force-uuid -use-pre-commit-hook -use-post-commit-hook \
    			-parent-dir \
    			-wait \
    			-bypass-hooks \
    			-use-pre-revprop-change-hook -use-post-revprop-change-hook )/' \
    			'p/2-/d/'
    

    Tue,14 Sep,2010

    篠原涼子、恋しさと せつなさと 心強さと、1994.7.21、 の別バージョン。

    Wed,15 Sep,2010

    Anthy ベンチマークテスト。
    Fri,03 Sep,2010に、 MBRビタビのコーパス無しモードを追加。
    ……コーパスの貢献って、正答率向上2%だけ?
    あれだけ苦労してたった2%?

    JR西日本が、(事故等で)衝突した際の衝撃を吸収して 乗客への衝撃を半減するとか言う、新型車両(225系?)を どうのこうのと、ニュースで言っていた。
    ……、以前、113系が(事故等で)衝突すると、 車両前部が潰れて運転士が死んでしまうとかで、 装甲板?を増設する改造をしたとか何とか言う話を思い出した。
    ……、225系は、衝撃を斜め上に逃がす構造になっているので、 乗客も運転士も安全?らしい。

    Anthy 拙作パッチ。
    Makefile.am を書き間違えているのを見つけた。 後で治す。
    治した。

    Thu,16 Sep,2010

    sb-ssl.google.com:443 の証明書が、また更新になっていた。 古い方の期限は 2010/08/05〜2011/08/05 で、まだたっぷり余裕があるのに……。 新しい方の期限は 2010/09/02〜2011/09/02 だった。 毎月更新しているのだろうか?

    時計。
    ふと気付いたら3分くらいずれていた。 最後に合わせたのっていつだっけ。
    2年近く、あるいはそれ以前(4年?)だから、 何となく、年差1〜2分くらいな気がする。
    日差で 0.16〜0.33秒くらい。
    週差で 1.2〜2.3秒くらい。
    月差で 5〜10秒くらい。

    計算機の時計。
    こちらは嫌と言うほど狂いまくるのは既に承知。
    1週間で1〜2秒は狂う。

    Feb:	-2.4sec /   6day = 0.40sec/day
    Mar:	 4.9sec /  50day = 0.10sec/day
    Jul:	14.4sec / 101day = 0.14sec/day
    Aug:	10.6sec /  30day = 0.35sec/day
    Oct:	 5.8sec /  26day = 0.22sec/day
    Oct:	 4.5sec /  20day = 0.23sec/day
    Jan:	 5.0sec /  70day = 0.07sec/day
    Apr:	 5.5sec /  59day = 0.09sec/day
    Jul:	22.2sec / 108day = 0.21sec/day
    Aug:	10.6sec /  25day = 0.42sec/day
    Sep:	 4.5sec /  11day = 0.41sec/day
    この個体は案外狂っていなかった。
    夏から秋にかけてずれやすいらしい。
    

    Anthy 拙作パッチ。
    かな漢字変換 anthy で、個人用学習データを活用して、なんかもう思い付く事を何でもかんでも試してみて、変換結果の改善を目指すパッチ

    これにて、溜まっていたバックポート予定は全て完了。
    Wed,04 Aug,2010、 「nosuke(のすけ)氏 - 日記みたいな何か - 2010年 7月30日 (金) - Anthy」、 Sun,15 Aug,2010Mon,16 Aug,2010 〜 Wed,18 Aug,2010、 辺りで挙げられていた問題を解消しています。

    Fri,17 Sep,2010

    かな漢字変換ベンチマークテスト。
    sj3 を追加。 → Fri,03 Sep,2010

    FreeWnn と Canna と Mozc と ATOK は、 自動変換させると文節区切り位置が確認できないとか、 読み仮名を流し込んで自動変換させるソフトが無いとか、 そもそも持っていないとか、 なのでパス。
    どなたかやっていただけませんですかね(他力本願)。

    Mon,20 Sep,2010

    https の証明書。
    いくつかのサイトで、中間証明書が、 「Cybertrust Japan Public CA; ; "Betrusted Japan Co., Ltd."」 から 「Cybertrust Japan Public CA G1; ; "Cybertrust Japan Co., Ltd."」 に変わっていた。

    Tue,21 Sep,2010

    FreeBSD 6 で NFS。
    Thu,11 Feb,2010の続き。
    また mountd が
    bindresvport_sa: Address already in use
    出して起動しない場合があった。 今度は rpcbind とぶつかったらしい。 確率だけで言うと 512〜384 ぶんの 1 くらいの筈なのだけれど。

    web のアクセスカウンター。
    *.hatena.ne.jp のサイトのアクセスカウンターを 阻害できるか否か試してみた。
    駄目だった。
    wget を1発飛ばしただけでも、ちゃんとカウントしていた。

    Wed,22 Sep,2010

    駅前のコンビニがまた1軒無くなっていた。

    10式戦車ってもう配備されていたのか……。
    しかも、懸案だった小型化も、0.5回り〜一回り程度とは言え、 実現しているのか。その上性能はそのままに。

    tcsh の history。
    Fri,18 Dec,2009の続き。
    history -S および exit時の自動保存の際には、 時間順ソートが行われるけれども、 history -L は、 単純にヒストリバッファの最後に継ぎ足すだけなのね……。
    時間順ソート付き読み込みは history -M だそうで。

    Thu,23 Sep,2010

    文節区切り位置の決定に使えるかもしれない、 探索アルゴリズムの話。

    ダイクストラ法(Dijkstra法)
    言わずもがなの古典でありながら鉄板な方式。

    ウォーシャル・フロイド法(Warshall-Floyd法) (ワーシャル・フロイド?)
    変換文字数が 40文字、 同じ読み仮名の文節には単語が1パターンしか存在しない、 と仮定すると、 探索すべき全ノード数は最大 820。
    同上で、同じ読み仮名の文節には単語が3パターン存在すると仮定すると 探索すべき全ノード数は 2460。
    ウォーシャル・フロイド法だと、 2460*2460 の行列を 12回ループ計算するので、 計算量は 178425433440 回。
    1GHz の計算機で計算1回が 1クロックで終了すると仮定しても 178秒かかってしまう。 4GHz にて IPC が 10 と仮定しても約5秒。
    ……そう言えばこれ、全探索だよね……。

    ベルマン・フォード法(Bellman-Ford法)
    ずばり、重みが非負ならダイクストラ法の方が速いらしい。

    A* (A-star)
    未評価領域のヒューリスティックなんか求められないので不可。

    D* (D-star)
    同上。

    PRM / RRT(Probabilistic RoadMap 法)
    トンデモ変換が連発する事が目に見えているので不可。

    Sat,25 Sep,2010

    CD。
    SILPHEED のサントラ CD が売っていた。 中古で¥4,950-……。

    ノートPC。
    12インチ以上15インチ未満で、 画面解像度の縦が900以上、 で検索したら、 ThinkPad と Let's note しかヒットしなかった……。
    HP dv4a/CT NQ157PA ¥32,700- なんて面白そうなのだけれども、 Sempron なのがどう効いてくるかと、1280x800 なのと。

    Sun,26 Sep,2010

    screen で tcsh。
    Fri,11 Dec,2009、 の続き。
    バグか何かで screen が落ちたら、 screen で起動中の tcsh が一斉に終了すると共に、 一斉に ~/.history に同時書き込みを行ってしまい、 ~/.history が壊れた。
    ロック取っていないのかな?、うーん。

    screenの話は、 Fri,15 Oct,2010、 に続く。 tscreen の話は、 Sat,16 Oct,2010Wed,20 Oct,2010Thu,21 Oct,2010Fri,22 Oct,2010Fri,17 Dec,2010、 に続く。

    自転車。
    Tue,06 Apr,2010の続き。
    なんかもう、後輪の溝が無くなって、 つんつるてんになっているんですが……。 ところどころ、 ブレーキでロックを起こしてスリップしてしまった箇所や、 カーブでタイヤが滑ってドリフトを起こしてしまった箇所などで、 中のワイヤーが見えてしまっているし。 全然ロングライフじゃない……。

    Tue,28 Sep,2010

    かな漢字変換ベンチマークテスト。
    「原作版 anthy-9100h + alt-depgraph-100120」、 「実験版(patch13-testing-2010927)」、 「コーパス無し」、 を追加。 → Fri,03 Sep,2010

    MBR-Viterbi を、 MBR-片方向Dijkstra に変えたら、速くなるだろうか遅くなるだろうか。
    MBR-Viterbi を、 シングルコア用 MBR-双方向Dijkstra に変えたら、速くなるだろうか遅くなるだろうか。 概算で、片方向ダイクストラの2倍くらい速くなる見込みが有るけれど。 でも、原作版の Anthy は再入を全く考えていない造りなので、 Anthy を全部捨てて最初から書き直さなければならない可能性がある……。
    MBR-Viterbi を、 2コア用 MBR-双方向Dijkstra に変えたら、速くなるだろうか遅くなるだろうか。 概算で、シングルコア用双方向ダイクストラの さらに2倍くらい速くなる。 片方向ダイクストラからなら4倍くらい速くなる可能性がある。 実際には、 メモリバスの奪い合い/複数コア間のキャッシュの更新が起きるので、 2倍には届かない筈。 あと、セマフォの奪り合い部分を小さくするのが結構面倒だった筈。 とどめに、そもそも Anthy はマルチタスク動作を考慮していない造り……。
    A* や D* は、 ヒューリスティックを得る事が出来ないから無理。 一見、「評価地点から数えた残り文字数」から な気がするが、 実際の文節接続確率は 0.000001〜1.0 の範囲内である所までは自明だが、 具体的な最悪値は文節接続確率を実際に計算しないと求まらない。 なので、∀n, 0 ≦ h*(n) ≦ h(n) (n は文字位置)において、 h(n) が 1.0〜1000000.0(文節接続確率の逆数)の範囲でどんな値をとるか全く判らないので、 h*(n) は 1.0 にするしかない。つまるところダイクストラ法と同じになってしまう。
    補足1:
    Anthy の文節接続確率は f(n) = g(n) * h(n) と規定されている。
    補足2:
    『「絶対に接続しない文節」であるか否かを機械的に判別する事はできない』と言う事で、 文節接続確率の最悪値を 1.0e-06 で切っているそうな。
    補足2の補足:
    「文末属性」は特例。

    Wed,13 Oct,2010 - Thu,14 Oct,2010 追記:
    補足1の補足:
    ……あれ? ダイクストラ法は f(n) = g(n) + h(n) と規定されているけれど、 f(n) = g(n) * h(n) のような形では使えたっけ? g(n) が単調増加なら構わないんだっけ?

    Sun,05 Dec,2010Thu,18 Aug,2011Sat,20 Aug,2011Mon,22 Aug,2011Wed,24 Aug,2011Thu,25 Aug,2011 に続く。

    Wed,29 Sep,2010

    ノートPC。
    13〜14inch で縦 900pixel 以上が欲しい。
    ソースコードをいじっていると、 1050pixel で 73行程度、 900pixel で 62行程度、 になる。 800pixel で 55行程度となると、狭くて……。

    Panasonic Let'snote。
    画面解像度の縦900以上の Let's note って、 現行品だと CF-F9 14.1inch(¥199,800-) 1440x900 しかない……。 20万円前後もするし……。
    生産終了品でスペックも考えると CF-Y7DWJAJR (2008/05)、
    CF-Y8E (2008/10)、
    CF-F8E (2008/10)、
    CF-Y8F (2009/02)、
    CF-F8F (2009/02)、
    CF-F9J (2010/02)。
    しかもそれでも全部 1440x900 で、 縦1000に届いていないし……。

    Mac。
    MacBook Pro 15inch 1440x900 ¥168,800-
    MacBook Pro 15inch 1680x1050 ¥178,880-
    MacBook Pro 17inch 1920x1200 ¥218,800-
    らしい。

    Lenovo。
    ThinkPad T510/T510i 15.6inch 1600x900 ¥105,210〜¥129,360〜
    ThinkPad T410/T410i 14.1inch 1440x900 ¥107,310〜¥130,410〜
    ThinkPad T510/T510i 15.6inch 1920x1080 ¥128,310〜¥146,160〜
    ThinkPad T410s/T410si 14.1inch 1440x900 ¥139,860-
    ThinkPad X201s 12.1inch 1440x900 ¥149,940-
    ThinkPad W510 15.6inch 1600x900 ¥210,420-
    ThinkPad W510 15.6inch 1920x1080 ¥227,220-

    VAIO。
    Outlet F-series VGN-FW94 16.4inch 1600x900? 1920x1080? 売り切れ?
    E 14.0inch 1600x900 直販モデル ¥64,800〜¥89,800〜 Celeron P4600 2GHz 2GB / Core i5-460M 4GB, 320GB(5400), DVDスーパーマルチ, 2.35kg
    E 15.5inch 1920x1080 直販モデル ¥84,800〜¥104,800〜 Celeron P4600 2GHz 2GB / Core i5-460M 4GB, 320GB(5400), DVDスーパーマルチ, 2.7kg
    F 16.4inch 1920x1080 直販モデル ¥99,800〜¥114,800〜 Core i3-370M 2GB / Core i5-460M 4GB, 320GB(7200), DVDスーパーマルチ, 3.1kg
    B 15.4inch 1440x900 直販モデル ¥112,800-
    F 16.4inch 1920x1080 量販店仕様 ¥145,600-
    Z 13.1inch 1600x900 直販モデル ¥149,800-
    Z 13.1inch 1920x1080 直販モデル ¥154,800-
    B 15.4inch 1440x900 量販店仕様 ¥159,800-
    Z 13.1inch 1600x900 量販店仕様 ¥239,800-

    DELL。
    Studio 17 17.3inch 1600x900 ¥89,980- Core i5-460M 2.53GHz 3MB, DDR3 4GB, 320GB(5400), DVDスーパーマルチ, a/b/g/n, 3.2kg
    Studio 15 15.6inch 1920x1080 ¥95,230- Core i7-740QM 1.73GHz 6MB, DDR3 4GB, 500GB(5400), DVDスーパーマルチ, b/g, 2.52kg
    Studio 15 15.6inch 1920x1080 ¥105,229- Core i5-460M 2.53GHz 3MB, DDR3 4GB, 640GB(5400), ブルレイドライブ, a/b/g/n, 2.52kg
    Studio 17 17.3inch 1920x1080 ¥105,730- Core i5-460M 2.53GHz 3MB, DDR3 4GB, 320GB(5400), DVDスーパーマルチ, a/b/g/n, 3.2kg
    Alienware M15x 15.6inch 1600x900 ¥149,980-
    Alienware M15x 15.6inch 1920x1080 ¥179,980-
    Alienware M17x 17.0inch 1920x1200 ¥199,980-

    HP。
    dv7/CT 17.3inch 1600x900 ¥89,460〜 Core i5-450M 2.40GHz 3MB, DDR3 2GB, 320GB(7200), DVDスーパーマルチ, b/g/n, 3.05kg

    NEC。
    LaVie G Type-L 16inch 1920x1080 ¥128,205- Core i5 460M 2.53GHz
    VersaPro J Type-VX 15.6inch 1600x900 ¥81,060〜¥130,200〜 Celeron P4600 2GHz / Core i5 560M 2.66-3.20GHz 3MB
    VersaPro J Type-VD 15.6inch 1920x1080 ¥99,540〜¥153,930〜 Celeron P4600 2GHz / Core i5 560M 2.66-3.20GHz 3MB

    東芝。
    Qosmio G65W/90MW 18.4inch 1680x945 ¥119,800- Core i5 450M 2.40GHz
    Qosmio G65W/90MW 18.4inch 1920x1080 ¥164,800- Core i7 620M 2.66GHz
    Qosmio G65W/90MW 18.4inch 1920x1080 ¥194,800- Core i5 520M 2.40GHz
    Qosmio T780/WTTA 18.4inch 1920x1080 ¥199,800- Core i7 740QM 1.73GHz

    富士通。
    Refreshed FMVNA7BE4 15.4inch 1680x1050 ¥59,200- Core2Duo T8100 2.10GHz
    Refreshed FMVNE8HEC 15.4inch 1680x1050 ¥70,200- Core2Duo T9400 2.53GHz
    LIFEBOOK NH900/ANT 18.4inch 1920x1080 ¥136,800- Core i5 450M 2.40GHz
    LIFEBOOK NH900/BND 18.4inch 1920x1080 ¥157,505- Core i5 560M 2.66GHz
    NH900/5AT FMVN905AT 18.4inch 1920x1080 ¥160,000?
    NH900/5BD FMVN905BD 18.4inch 1920x1080 ¥219,800-

    MSI。
    FX600 FX6I46-N11P 15.6inch 1920x1080 ¥118,000-
    GT640 G64QI7-N10B 15.4inch 1680x1050 ¥140,000?
    GX660R GX66I7-2FHR 15.6inch 1920x1080 ¥190,000?
    GT660R GT66I7-2FHN 15.6inch 1920x1080 ¥190,000?

    ACER。
    TM7740-W422 17.3inch 1600x900 ¥100,000?
    AS7745G-N78H/L 17.3inch 1600x900 ¥169,900-
    AS8940G-BR101 18.4inch 1920x1080 ¥190,000?
    AS8935G-BR64 18.4inch 1920x1080 ¥190,000?
    AS8930G-B484 18.4inch 1920x1080 ¥230,000?

    Gateway。
    P7900-37FX 17inch 1440x900 ¥190,000?

    ドスパラ。
    Prime Note Chronos MR5 15.6inch 1920x1080 ¥105,979- Core i5 560M 2.66-3.20GHz 3MB
    Prime Note Galleria MR4 15.6inch 1920x1080 ¥119,980- Core i7 740QM 1.73-2.93GHz 6MB
    Prime Note Galleria MR5 15.6inch 1920x1080 ¥119,980- Core i7 740QM 1.73-2.93GHz 6MB
    Aspire AS7745G 17.3inch 1600x900 ¥139,800- Core i7 720QM 1.60-2.80GHz 6MB

    Faith。
    WSR T33000/DVR 17inch 1440x900 ¥64,294- Celeron T3300 2.00GHz 1MB
    WXS P4500XA/DVR 17inch 1440x900 ¥76,100- Celeron P4500 1.86GHz DualCore 2MB
    WX i5540XA/DVR 15.6inch 1600x900 ¥94,800- Core i5 540M 2.53-3.06GHz 3MB
    WX i5460XA/DVR 15.6inch 1600x900 ¥96,100- Core i5 460M 2.53-2.80GHz 3MB
    WGO i5540XN/DVR 15.6inch 1600x900 ¥99,800- Core i5 540M
    WX2 i3350XA/DVR 15.6inch 1600x900 ¥83,800〜¥100,600- Core i3 350M / Core i5 460M 2.53GHz
    WXS i3350XA/DVR 17inch 1440x900 ¥89,800〜¥101,875- Core i3 350M 2.26GHz / Core i5 540M 2.53GHz
    WXS i5540XA/DVR 17inch 1440x900 ¥106,100- Core i5 540M 2.53GHz
    WX2 i5540XA/DVR 15.6inch 1600x900 ¥119,800- Core i7 740QM 1.73-2.93GHz 6MB
    MTS i7740XN/DVR 15.6inch 1920x1080 ¥134,800- Core i7 740QM 1.73-2.93GHz 6MB
    MTX2 i5540XN/DVR 15.6inch 1920x1080 ¥139,800- Core i5 540M 2.53-3.06GHz 3MB
    MTX2 i7740XN/DVR 15.6inch 1920x1080 ¥149,800- Core i7 740QM 1.73-2.93GHz 6MB
    WXS i7740XAS/DVR 17inch 1440x900 ¥159,800- Core i7 740QM 1.73-2.93GHz QuadCore-HT 6MB

    PC工房。
    CLS734 17inch 1440x900 ¥49,980(OS無)〜¥66,480(OS有)〜 Celeron T3300 2.00GHz 1MB
    CLG647 15.6inch 1600x900 ¥84,980(OS有)〜 Core i5 450M 2.40GHz DualCore-HT 3MB
    CLG736S 17inch 1440x900 ¥67,980(OS無)〜¥85,980(OS有)〜 Celeron P4500 1.86GHz DualCore 2MB
    CLG647G 15.6inch 1600x900 ¥94,980(OS有)〜 Core i5 560M 2.66GHz DualCore-HT 3MB
    CLG637HG 15.6inch 1600x900 ¥80,980(OS無)〜¥95,980(OS有)〜 Core i5 560M 2.66GHz DualCore-HT 3MB
    CLG736 17inch 1440x900 ¥80,980(OS無)〜¥98,480(OS有)〜 Core i3 350M 2.26GHz 3MB / Core i5 450M 2.40GHz
    CLG637H 15.6inch 1600x900 ¥77,980(OS無)〜¥101,480(OS有)〜 Core i3 350M 2.26GHz 3MB / Core i5 450M 2.40GHz
    CLG736G 17inch 1440x900 ¥97,980(OS無)〜¥109,980(OS有)〜 Core i5 450M 2.40GHz DualCore-HT 3MB
    CLG637HG-BDE 15.6inch 1600x900 ¥87,980(OS無)〜¥111,480(OS有)〜 Core i3 350M 2.26GHz 3MB / Core i5 450M 2.40GHz
    CLG648 15.6inch 1920x1080 ¥97,980(OS無)〜¥115,980(OS有)〜 Core i5 450M 2.40GHz DualCore-HT 3MB
    CLG637HGX 15.6inch 1600x900 ¥107,980(OS無)〜¥119,980(OS有)〜 Core i7 740QM 1.73-2.93GHz QuadCore-HT 6MB
    CLG736GX 17inch 1440x900 ¥117,980(OS無)〜¥129,980(OS有)〜 Core i7 740QM 1.73-2.93GHz QuadCore-HT 6MB
    CLG648G 15.6inch 1920x1080 ¥130,980(OS無)〜¥142,980(OS有)〜 Core i7 740QM 1.73-2.93GHz QuadCore-HT 6MB
    CLG637HGXR 15.6inch 1600x900 ¥132,980(OS無)〜¥149,980(OS有)〜 Core i7 740QM 1.73-2.93GHz QuadCore-HT 6MB
    CLG736GXR 17inch 1440x900 ¥132,980(OS無)〜¥149,980(OS有)〜 Core i7 740QM 1.73-2.93GHz QuadCore-HT 6MB
    CLG641G 15.6inch 1920x1080 ¥137,980(OS無)〜¥149,980(OS有)〜 Core i5 450M 2.40GHz DualCore-HT 3MB
    CLG641GX 15.6inch 1920x1080 ¥145,980(OS無)〜¥157,980(OS有)〜 Core i7 740QM 1.73-2.93GHz QuadCore-HT 6MB
    CLG703GX 17inch 1920x1080 ¥197,980(OS無)〜¥209,980(OS有)〜 Core i7 740QM 1.73-2.93GHz QuadCore-HT 6MB
    CLG800EXGXR 18.4inch 1920x1080 ¥452,980(OS無)〜¥474,980(OS有)〜 Core i7 940XM 2.13-3.33GHz QuadCore-HT 8MB

    マウスコンピュータ。
    MB-D920S2 18.4inch 1920x1080 ¥102,900-
    MB-P763B 15.6inch 1920x1080 ¥143,010-
    MB-G812B 17.3inch 1920x1080 ¥162,750-

    中古CD
    今日は割引の日だったらしい。
    GUNDAM X SIDE.2 ¥500→250-
    MACROSS PLUS O.S.T.1 (JVC版) ¥500→250-
    MACROSS PLUS O.S.T.2 (JVC版) ¥500→250-

    Thu,30 Sep,2010

    昨日のノートPCの解像度の話の続き。
    CDR/TK氏の助言で、フォントを小さくすればいい事を思い出した。
    現在 7x14。
    5x7 とか 5x8 にしたら読めなかった。
    だいたい 6x12 〜 6x13 くらいが限界くらいだった。 5x10 はきつい。
    7x14 で 1440x1050 だと 203x73 の所を、 6x12 なら、 1366x768 で 225x62 くらい、 1600x900 なら 264x73 くらい。


    2010年の4に続く。


    FENIX HomePage
    G-HAL HomePage
    Mail to, メールはこちらへ
    Suggestion Box, 投書箱
    BBS, 掲示板 UserName:BBS、Password:BBS
    (C) 2010 G-HAL