Google翻訳の韓国語-日本語がおかしい。

Google翻訳は一般的に便利なツールだが、韓国語-日本語の単純な翻訳が壊滅的におかしい。 韓国語能力1歳児未満相当から見ても明らかにおかしい。

셀카(自撮り) → ハメ撮り
사라지다(消える) → ゴーン
치다(打つ、叩く)  → プルーン
가져가다(持っていく) → インポート行く

셀카(セルカ:セルフィーの韓製英語でセルフカメラの略)は韓国語を知らない人でも「セルカ棒」とか言う言葉で日本でも結構知られているのに、Googleでは「ハメ撮り」ということらしい。これ前後の文があっても 「셀카」を常に「ハメ撮り」と訳すみたいだから最近のAIの理解力は大したものだ。사라지다(サラジダ)は初級単語で「消える」という意味なのにGoogleは「ゴーン」。カルロスゴーン? 사라지다(朝鮮語)→gone(英語:消える)→ゴーン(日本語??)  とか何かの連想ゲーム? 意味不明。 ゴー(Go)くらいは外来語として定着していても、日本語でgoneはまず使わない。

치다(チダ)も超初級単語で「打つ」という意味なのにGoogleは「プルーン」。プルーン(すもも)は本当は자두(チャドゥ)というらしいが、치다が자두の訳語になるのか全く分からない。가져가다(カジョガダ)コンスニの動画で出てきたような気がするから幼児でも知ってるはずなのに「インポート行く」などと今まで一度も聞いたことが無い日本語に。世界でも随一の優秀な頭脳集団が開発した翻訳ツールだし、文章の前後関係からもっと良い結果が得られるのかと思って簡単な例文を翻訳させてみる。

例文:”가져가은 셀카봉으로 머리를 쳤어요.”
文意:「持って行ったセルカ棒で頭を打ちました。」

Google:「インポートカウンハメ撮り棒で頭をこすり。」

時制めちゃくちゃ! なおかつ連用形止め!!

おまえは何を言っているんだ?」

こんな簡単な文章なのに、だいたい内容は分かるとか雰囲気は伝わるとかいう次元を超越してる。

なお、韓国語→英語の場合はもう少しましで、
例文:”가져가은 셀카봉으로 머리를 쳤어요.”
Google英訳:”I hit my head with a stick of rope.”

さらに最後の.を消すと「가져가은」を「Take の過去形 」と解釈する。ただしつける位置がおかしい。
原文:”가져가은 셀카봉으로 머리를 쳤어요”
Google英訳:”I hit my head with the sticks I took.”

これを日本語訳するとインポートカウンハメ撮り棒よりは良い結果になる。
Google英→日:「私は取った棒で頭を叩いた。」



セルカの誤訳は2018年の時点ですでに話題になっていたようだが全く改善されていない。 日本語と韓国語は文法上の類似点や漢字圏由来の類似性が多くあって翻訳しやすそうなのに。もうちょっとなんとかならんのか。

韓国製のNever翻訳のがだいぶまし。
原文:”가져가은 셀카봉으로 머리를 쳤어요.”
Never翻訳:「 持って行ったセルカボンで頭を殴りました。 」

最近、中国製品で変な日本語の誤訳を見つけた。機能の「オン、オフ」の選択肢が「オン、オープン」になっている。英語は「On、Off」で問題ない。韓国語を見るとコングリッシュで「온(オン)、오프(オプ)」になっていた。カタカナ表記で「オプ」を近い言葉にするとオープンが近いから間違ったのだろうか。

広告

韓国アニメは日本にも受け入れられるか。

ハングルで書かれたウェブページを解読したくて覚え始めたら、Youtubeでいろいろな韓国語の動画を見るようになった。

最近韓国の子供向け動画を見始めた。まだ知っている単語や言い回しをなんとか拾える程度で韓国語を理解できるというにはほど遠い。子供向けでこれだから韓国ドラマを字幕なしで見るにはまだまだ時間がかかりそう。南北朝鮮の子どもたちはこういう言葉で楽しんでいるのと思うと感心する。

日本のアニメは「日本国内では」世界一と聞かされているが、実際はどうなのか。

韓国アニメ、世界キッズ市場で第2の全盛期 – 中央日報
https://japanese.joins.com/article/j_article.php?aid=202938

韓国の新聞記事だし自画自賛で話半分としても、昨今の韓流ブームを見るにつけ各国への売り込みは成功しているのだと思う。この記事で取り上げられている「콩순이(コンスニ)」、女児向けアニメで現在韓国では女児からの絶大な人気を誇るらしい。Youtubeで見てみるとなかなかおもしろい。シリーズ名では「엉뚱발랄 콩순이와 친구들」(オンットゥンパルラル コンスニワ チングドゥル:とってもはつらつ コンスニとお友達)となっている。

フル3D CGアニメーションで動きがキモかわいい。子供向けで話自体は簡単なので言葉が分からなくても楽しめる。コンスニの母親は表情が育児ノイローゼ気味だと思う。出てくるあらゆるものが徹底的に商品化を意識していて正直子供にはあまり見せたくない気もするが、止められないだろう。

今のところ日本では調べても個人ブログが数件と自動翻訳のアマゾン商品ページが引っかかるくらいであまり知られていないが、韓国ではアニマックスやKBSやディズニーチャンネルが噛んでいるし日本語化は時間の問題かも。英語版はすでに有り「Kongsuni and Friends」で展開している。

韓国ドラマやK-popは日本にも十分影響を与えたが、韓国アニメは今の日本に十分浸透しているとはいいがたいし、今後の動向はサプライヤーのさじ加減ひとつだと思う。

人間の腕は逆にも曲がるのが普通

もう暑いから半袖にかえた。この時期になると結構な猿腕を目撃されて気持ち悪っ、ていわれる。

専門用語だと過伸展、反張肘、後屈とか言う。長濱ねる城恵理子KARAヨンスンとかが特技とか言って自慢してるし、ずっと前の小泉今日子が現役のころにも言ってた。男性アイドルでも二宮和也とか伊野尾慧とかK-POPの男性アイドルのだれだかも相当の猿腕だった。でも人間の肘って逆に曲がるのは普通なんですよ。曲がらん方がおかしいとまでは言わないけど。それか逆に曲がることに気づいてない。

人間特性計測データベース
http://www.tech.nite.go.jp/human/index.html

ここから肘関節の伸展を取り出してExcelでグラフにしてみる。

elbowrom.png

肘の伸展角度の分布はこんな感じ。グラフの中央、0のところよりグラフの山が右側に寄っていて過伸展する人が半数よりも多いことがすぐにわかる。数値にするとこんな感じ。

  • 最頻値は男性も女性も6度。頻度2位は8度、3位は男性13度・女性12度。
  • 平均値は男性6.7度、女性8.9度。標準偏差は男性11.0度、女性10.6度。
  • 最大値は男性32度、女性37度。

解剖学的には肘関節の可動域(ROM)は伸展0~5度が正常、女性・子供では~10度は普通。15度以上が過伸展と言われるが、実際の測定値ではボリュームゾーンは5~15度くらい、この範囲だと性差もあまり無い感じ。統計は自動可動域(補助なしで動く範囲)しかないので、他動可動域(外からの力で動かす)だともっと過伸展側になりそう。余裕で40度以上逆に曲がるような人は男女とも見たことあるし、もっとすごい人だと60度以上曲がる高校男子(彼はMarfan-Syndromeだったかもしれない)や、腕に体重をかけて120度くらい(完全に逆向き)に曲がってるのに平然としてる女の子を見た。過伸展は伸ばしてると広がっておかしくなるので猿腕をひどくしたくない人は腕に体重をかけて反らす動作はやらない方がいいかも。

まっすぐよりも伸びない側(左側)を見ると、グラフでは青い部分が目立ってて男性のが多い。これはムキマッチョで伸展制限があるとかかな。それでも女性と比較して目立つという程度であって、グラフの右側の男性に伸展制限は無いか過伸展するわけで「女性・子供は肘が過伸展する」(=過伸展しないのは成人男性のみ) なんていうより「成人男性には肘が伸び切らない人もいる」くらいのがジェンダーがフリー。

元データから過伸展する人の割合を数値で出してみる。カッコ内は正規分布に当てはめた場合の確率。反る反らないだけなら8割近くが反るし、過半数が5度を超える。4割以上の10~15度だと結構逆に曲がってる感は出るはずで、20度以上曲がる人は両肘の内側をくっつけられる。

  • 0度以下 ・・・ 23.7% (23.5%)
  • 0度を超える ・・・ 76.3% (73.5%)
  • 5度を超える ・・・ 61.3% (60.3%)
  • 10度を超える ・・・ 41.3% (42.0%)
  • 15度を超える ・・・ 23.5% (25.4%)
  • 20度以上 ・・・ 13.2% (13.0%)
  • 30度以上 ・・・ 1.35% (2.00%)

はっきりいって肘が逆に曲がらない人は0度を含めても2割、5人に1人しかいない少数派。15度以上反るような人だって25%、4人に1人くらいいるわけで逆に曲がらない人よりも多いし、程度の差はあっても8割の人は腕が逆に曲がる。日本語には「指が手の甲につく」ことを意味する単語は無いが、「腕を伸ばして両肘がくっつく」ことを意味する単語が「猿腕」として存在するわけで国語辞書にも載ってるくらい一般的なこと。腕逆に曲がってるキモい、そんなに曲がるわけ無いなんていう人は己がマイノリティだと思い知るがよい。

よくいう猿腕とはどういうものかは次のサイトのイラストがわかりやすい。(内容は若干疑問)

細身の女子に多い!スラリとした腕の敵「猿腕」って何?
https://moteco-web.jp/diet/20139

よくいう猿腕は肘が後屈して伸びすぎる過伸展(反張肘)によるものと、腕が肘から外側に反る(外反肘)キャリーアングル(外反角)によるものがあって、それに肩の回転や上腕三頭筋まわりの弛み(二の腕振り袖)が組み合わさると「曲がりすぎー」に見える場合があるっていうのが自分的な結論。外反角が大きいと過伸展無しでも猿腕になるから、生理的外反の程度が大きい女性に猿腕が多いというか大半がそうだというのはたぶん正しい。ただし、今回確認した過伸展度合いに関してだけを見れば男性女性はほとんど関係ないし、ヤセとか太ましいも関係無い様子

コミケでNHKが宣伝やってる。無駄遣いじゃないの。

NHK“薄い本”2度目も変わらぬ人気ぶり 3時間で配布数量残り半分に
http://news.livedoor.com/article/detail/11010012/

無償で配布ってことは、皆様からの受信料を使ったってことでしょ。コミケなんて興味ないし、NHKの受信料は家族で払ってるし、関係ないところに金つぎ込んでるとかむかつくわー。NHKなんてニュースと速報はインフラなので基本無料にして、特定層向けの教育番組とかNHK出版連動の教養番組とか、ガキ・オタク向けアニメとかジジババ向け娯楽番組とか海外向けは月額有料かペイパービューで提供すべきだと強く思う。スカパーもアクトビラもやってるし、つぶれそうだったWOWOWですらNHKが開発に携わってるはずのB-CAS使ってやってるのに、NHKにできないわけがない。怠慢このうえない。

ニュースも通信社から仕入れて読んでるだけでいいし、FMとかBSとかそもそも要らんし。TVも一波にしてB-CASでガチガチに視聴制御、それとラジオもAM一波にして、短波のラジオジャパンはNHKから切り離して総務省か外務省直営の国営にしろって感じ。

bchunkをWindowsで使えるようにする (bin+cue→wav変換)

先日から音楽CDをbin+cueファイルにイメージ化して現物を捨てる整理法を実行しているわけですが、bin+cue形式って割と扱いにくいんですよね。理想的にはbin+cueを複数曲が入ったデータとして直接再生できるプレーヤーとか無いし、ほかのソフトでも使いたいのでbin+cueから直接トラックごとのwavファイルが抽出できればそれでいい。

結構前からDAEMON Toolsという仮想ドライブソフトを使えばBIN+CUEを直接マウントして使えることは分かってるんだけど、いつの間にかアドウェア付きになってたり、そもそもいつまでサポートがあるか分からないしLinuxでは使えないしOSSでも無いのでこれだけに頼りたくない。Daemon Tools自体は使い勝手も良いし、プロテクト付きディスクのエミュレーションとかあって何かと有用なのは間違いないのだが。

ドライバを入れたりせず、もっとシンプルにbin+cueをwavなりisoに分解するには、Linuxだとbchunkというソフトがあって、Debianだとapt-getですぐ使える。で、Windowsでも使えないかと思って探したらokwaveでまさに同じようなことを考える先人を見つけた。

http://okwave.jp/qa/q3629100/a11028949.html

Q:bin+cueをbchunkでISOに変換したいのですが、bchunkのダウンロードの仕方がわかりません。

A:ちゃんと対応 OS とか書いてあるんだから読もうよ. それはあなたのシステムでは使えません. 別のものを探してください.Img Burn とかあるみたいね. シェアウェアかもしれんけど.

ImgBurnはフリーソフトだよちゃんと書いてあるんだから読もうよと ツッコミたくなるナイスなベストアンサー。とりあえずbchunkのWin32バイナリは無いと理解した。ありがとうokwaveの方々。あきらめてWindowsでbchunkをビルド。手元のパソコンにはVisual Studio 2010 Expressが入っていたのでそのまま使った。mingwとかcygwinのが変更は少なくて良いと思うが入れたくなかったので。

→ここで作ったバイナリとソースは掲載しました。

以下はソース改変&コンパイルのレシピ。バイナリだけ使えればいいっていう場合は読まなくていいです。

1.http://he.fi/bchunk/ から bchunk-1.2.0.tar.gz をダウンロード。適当に展開して作業開始。

.
2.strcasecmpの定義を追加。bchunk.c の編集前26行目付近に追加する。

#ifdef _MSC_VER
//not #if defined(_WIN32) || defined(_WIN64) because we have strncasecmp in mingw
#define strncasecmp _strnicmp
#define strcasecmp _stricmp
#endif

出典 http://stackoverflow.com/questions/3694723/error-c3861-strcasecmp-identifier-not-found-in-visual-studio-2008

.
3.unistd.h を追加。出典 http://d.hatena.ne.jp/deraw/20070517/1179334643 から unistd.h をもらってきて105行目を変更。

ft.dwHighDateTime = (DWORD)ll >>32;

ft.dwHighDateTime = ((__int64)(DWORD)ll) >>32;

そしてbchunk.c の編集前25行目付近のunistd.hのインクルードパスを変更。

#include <unistd.h>

#include “unistd.h”

→このunistd.hはライセンス不明なので使わないようにしました。必要なのはhtonsとhtonlだけなので次の二行を追加するだけです。

#pragma comment( lib, “ws2_32” )
#include <winsock2.h>

.
4.getoptを追加。出典 http://takamints.hatenablog.jp/entry/2015/04/27/231454 から getopt.h、getopt.c をもらってきて、bchunk.c の編集前26行目付近に追加する。

#include “getopt.h”

.
5.inttypeを削除。bchunk.c の編集前60、61行目付近を削除(コメントアウト)する。

//#include <inttypes.h>
//#include <netinet/in.h>

.
6.stdint.hを追加。出典 http://stackoverflow.com/questions/5657825/whats-the-equivalent-of-int32-t-in-visual-c

bchunk.c の編集前25行目付近をに追加。

#include <stdint.h>
.
7.BINファイルのオープンモードを変更。bchunk.c の編集前402行目付近を変更。

if (!((binf = fopen(binfile, “r”)))) {

if (!((binf = fopen(binfile, “rb”)))) {

.
8.出力ファイルのオープンモードを変更。bchunk.c の編集前282行目付近を変更。

if (!(f = fopen(fname, “w”))) {

if (!(f = fopen(fname, “wb”))) {

.
9.コンパイル。メイクファイルの変更は面倒なのでコンパイラドライバCLで直接ビルド。bchunk.exe が出来上がったら成功。

cl bchunk.c getopt.c

.
10.試してみる。

chunk -w image.bin image.cue track

でtrack*.wav がたくさん出てきたら再生してみる。

.
できたwavをNeroでリッピングしたwavと比較すると先頭に1ワードの余分(0000H)が出るのと、末尾付近にNeroが付けた変なチャンク部分が異なるけど、それ以外のデータはバイナリ一致したのでたぶん大丈夫だと思う。これでbin+cueもさくっとwavに変換して聞くことができる。知恵を貸してくださったインターネッツの先人の方々に感謝ですね。 めでたしめでたし。

wavとisoができることは確認したけどそれ以外の検証はちゃんとしてないので試すときは自己責任で。

オリジナルの作者ではないですが、bchunk v1.2.1がリリースされました。待望のWindowsサポートが! … て一部取り込まれとるやないかい!! ええのんか。getoptはMITライセンスやからともかく、strcasecmpとかunistd.hはライセンス不明やし。。

https://github.com/extramaster/bchunk

→自分のエントリに起因がないわけでもないんでOSSライセンスのみで再構成したものにMIMEエンコードしたアーカイブ公開の中身を差し替えました。

MD、HiMDの資産を引き継ぐにはFLAC? WAV?

MD、HiMDの録音データをせっせこせっせこPCに移している途中で、 今後のフォーマットについて考えていた。MP3、AACは最初から却下なので、 結論としてFLACなのだが、、

http://awabi.2ch.net/test/read.cgi/pav/1302521688/

PCM(WAV)最強なんていわれちゃってますねぇ。 FLAC結局半分にしかならないんだから。再生時の負荷が、ノイズが、とか言ってるけど、PCMのWAVってそもそも誤り検出・訂正機能が無いんですよねぇ。FLACならストリーミング再生も考慮されているのでエラー検出くらいはある。WAV最強な人って、LSBで1ビットのエラーが発生していても聞き分けられるんかしらん。PCMのLSBにステガノ風に任意のデータを埋め込むツール作ったけど、埋め込んでても聞く分にはまあわからんかった。wavをzip圧縮しておいて展開して聞くという手間を考えるならFLAC対応プレーヤでさくっと聞く方がよかろう。。

あ、ALACとかはAppleもiTunesも嫌いなんで。

FLACより遅く出てるのに、現時点で、
FLACより圧縮速度が遅くて、
FLACより圧縮率が低くて、
FLACより対応アプリが少なくて、
FLACより、まあいいです。

いずれにしてもWMA Lossless同様却下。
どうしても必要があればFLAC→wav逆変換の後になんとでもなる。

MD、HiMDの資産を引き継ぐ

うちにはMDの類はもともとあまり無いのだけど、それでも演奏会の録音用に使っていたMZ-RH10があるので生録HiMDが数十枚。HiMD本体も表示が激暗でだいぶキてるし、あわせて使っていたAIWAのマイクもだいぶヨレてきてるのかノイズも多いくて高域も落ちているようなのでMD、HiMDの資産自体を廃棄の方向で。世間的にMDはレンタルCDのコピー先という位置付けなので、「断捨離してもどうしても欲しいものはダウンロード販売できるし。」なんて気楽に言ってくれるじゃない。だがしかしマイク録音の資産はCDトラックを編集して、はいマイベストMD。って程度の気軽さでできるものじゃないんすよ。。

で、そこは壊れかけのHiMD。SonicStageなんていつの間にかディスコンになっててWin7、8では動かない。体験型・統合型アプリケーションx-アプリという(体験型って何なのか意味不明。) SonicStageの後がまを使って、せっせこせっせこ転送中。

HiMDをUSBで転送中

今やSonicStageはダウンロードもできない。http://www.sony.jp/support/pa_common/download/ss_dl_01.html

体験型・統合アプリケーション「x-アプリ」は64ビットにも対応。やったね。
http://www.sony.jp/walkman/software/music/index.html

x-アプリのインストールはSonicStageのように追加ダウンロードもしないし、変なドライバを追加で入れる必要も無く、あっさりしててなかなか良い。SCMSで保護されてそうな、CDからデジタルコピーしたMDの楽曲もあっさりwavに変換してくれた。ソニーの最後の良心かな。ただ残念だが、いくらアプリの使い勝手を向上させたところで所詮は独自規格。データの使い勝手が良くならなければこれ以上の依存は不要。手持ちのMD、HiMDの内容をFLACにコンバート完了したら、x-アプリには変換前の.omaデータとともに消えてもらうのだ。

 

「大人の科学」とがっかり感

学研から出版されている「大人の科学」という付録メインの書籍があります。
 
一度「テルミン」の号を買ったのだけど何このがっかり感。
所詮万人向けの付録とはいえ組み立てもネジを数本止めるだけ。「ものづくり」の雰囲気なんてありません。
他の号も立ち読みはしたけれど特に「望遠鏡」の号は買ったら最大級のがっかり感が味わえたことでしょう。
毎回なかなかおもしろいコンセプトで出してくるので興味はあるけれど、このがっかり感はいやだな。
 
書籍本体もあまりつっこんでは書かれておらず「○年の科学」テイスト。
「子供の科学」で育った人にはちょっと物足りないかな。
 
学研のふろくはこのひと月もつかどうかのあやうさとはかなさを楽しむためのものものだからこれでいいの
かもしれないけれど、ちょっと高望みしすぎか。