| 2010-05-04
(*)
|
# ギョエテくん |
|
ギョエテくん というサービスを作ってみた。
最初は「ガロア vs ガロワ 夜明けの決闘」みたいな名前にしようかと思ったけど、ゲーテの例の方が人口に膾炙しているかな、と思って名前は最後に変えた。
「ギョエテとは 俺のことかと ゲーテ言い」 と有名な川柳にあるように、外国人のカタカナによる表記には揺れがあります。 ここでは、そういった情報を収集してみたいと思います。
という内容。
正しさは、興味が無くてどれぐらいバラエティに富んだ用例を収集できるかなので、お暇な方はデータを投入して下さい。
使い方としては、最初のページにある検索で、原語(Göthe とか)やカタカナ表記(ギョエテ とか)で検索して、用例がなければ(あっても追加していいけど)フォームに誰がいつ使ったといった情報を追加して送信すれば OK。
|
|
posted at 22:28:32
#
|
|
| |
| 2010-04-18
(*)
|
# heap.sort() maintains heap invariant |
|
「heap.sort() はヒープを不変に保ちます」と訳されていたが、考えてみるとおかしい。
ソートして不変だったらソートされているわけだが、そんなに都合の良いことは起こっていない。
英訳の際に(相互に関連した)二つの間違いがあったのだと推測する。
一つめ、maintain は keep と違って目的語の状態を補語として付け加える構文が無いことを見落とした。
もう一つ、invariant を形容詞だと思った。
maintain の使い方は、ネイティヴならざる身としては辞書に頼るしかないが、どの辞書にも補語を受け付ける構文は出てこない。
だからここで invariant を形容詞だと思うことはできないはずである。
ところが invariant という語形は良くある形容詞のもので、名詞なら invariance じゃないかと思ってしまう。
実際形容詞としての用法の方が一般的だろう。
が、計算機科学で(というか元々数学用語として) invariant を不変式・不変条件などの意味で使う。
invariance としてしまうと不変性とかそんな意味になって文意が違ってくる。
ということで、heap invariant はこの2語で「ヒープ不変式」と訳すべきで、実際のところリスト(配列)に要素を格納する順番の不等式が問題の文の少し上で与えられていて、これを指していると解釈できる。
ということで「heap.sort() はヒープ不変式を保ちます」と(2.6の翻訳では(協力者は常に募集中))直しておいた。
翻訳でなく自分で書くなら「heap.sort() はヒープ不変式を崩しません」とか書くかもしれないけど、そこまで自分勝手に文を変えるのも悪いかなと遠慮した。
|
|
posted at 16:15:12
#
|
|
| |
| 2010-04-08
(*)
|
# W - G |
|
ゲリラの語源は英語の war と同じだという。
スペイン語で guerrilla は guerra に指小辞が着いた形だが、この guerra がその昔ゲルマン語から借用した単語なのだそうだ。
確かにラテン語だと BELLVM だもんね、そこから来る形ではない。
w から g に音が変わるのもちょっと想像が付かないけど。
w と g の対応と言えば、英語 William, ドイツ語 Wilhelm に対する Guillaume もあった。
これはフランス語。
世界史の資料集か何かに対応表があったが、一番理解できない対応だった。
フランス語 gaufre に対応するのは英語では waffle か wafer。
ベルギーワッフルなどというが、してみるとあれはオランダ系ベルギーか?
guarantee なんてフランス語 garantie を経由して(?)英語にたどり着いたけど warrant と元は同じってことだ。
他には何があるかな。
|
|
posted at 01:02:08
#
|
|
| |
| 2010-01-25
(*)
|
# いてろうたれ |
|
何度目か判らないが、iterator の訳語を考えた。
というか今回は訳語を考えるつもりではなかった。
ちょっとラテン語の教科書的なものをぱらぱらと読み返していただけだったのである。
iterator は iterate する人の意味だが、この iterate の元はラテン語であるはずである。
不定型で iterare となる第1活用というのが妥当な線だ。
ラテン語の辞書は持ち合わせていないので、確認はできないが多分間違いない。
ということで、現在の活用はラテン語の授業第一日で習うところのあの活用形。
itero, iteras, iterat, iteramus, iteratis, iterant.
皆さんご一緒に、いてろー、いてらーす、いてらと、いてらーむす、いてらーてぃす、いてらんと。
「いてらんと? おう、いてろうたれいてろうたれ」
なぜかここに、大阪風言語フィルターが乱入してきた。
自分で喋ることはなくても、どうも最近言葉の認識が歪んできているらしい。
ということで、こんなネタ。
五段動詞「いてらう」は主に近畿地方で使われる方言で「繰り返す」あるいは「回す」といった意味で使われる。
#383
用例: 「なんやトリッキーないてらい方してはりますね。for 文でいてらわはったらどないですの?」「簡単に、for 文でいてらえ、言うてくれはりますなあ。『何も考えんと、いてろうたれ』て上にも言われましてんけど」
#384
あ、iterator 自体の訳はなかったな。
流れで行けば「いてらうん」かな。
|
|
posted at 19:12:16
#
|
|
| |
| 2009-12-14
(*)
|
# せやねん |
|
「せやねん」
という大阪弁の同意の言葉を聞くと、それを発したのがたとえ二十歳前後のうら若き女性でも、六十がらみのおばさんの会話と認識してしまうおかしなフィルターが私の頭には組み込まれているらしい。
特にオチはない。
|
|
posted at 03:33:36
#
|
|
| |
| 2008-05-10
(*)
|
# 十二戒 |
|
ときどきの雑記帖経由で Twelve commandments for Beautiful Python code を読んだ。
PEP 8 に従え、と。
本筋と関係ないところで気になったのが、
Guido, who brought you out of the land of Visual Basic, out of the land of slavery, spake all these words to thee
という冒頭の文。
Guido を God になぞらえてモーゼの十戒をもじっているのは明らかなんだけど、微妙な違和感がある。
それは you と thee が両方出現しているという部分。
聖書の二つの英訳がごっちゃになっているんだろうな、ということでチェックしてみた。
まずは欽定訳(King James Version)から出エジプト記20.1-2。
And God spake all these words, saying,
I am the LORD thy God, which have brought thee out of the land of Egypt, out of the house of bondage.
spake all these words はここから。
しかし細かいことを言えば to thee より unto thee と書く方がそれっぽい。
そして「エジプトの地、奴隷の家から」の部分は少し異なるので、それを探してみよう。
多分、この New International Version。
And God spoke all these words:
"I am the LORD your God, who brought you out of Egypt, out of the land of slavery.
この二つの切り貼りで大体復元できそうだ。
以上、どうでもいい探索には BibleGateway.com を利用した。
日本語版は収録されていないので、手元の口語訳から。
|
|
posted at 11:42:08
#
|
|
| |
| 2008-01-20
(*)
|
# cocoa |
|
英語では「ココア」じゃなくて「孝行」と発音するのか。
|
|
posted at 23:02:40
#
|
|
| |
| 2007-12-21
(*)
|
# asthma |
|
「喘息」という英語の単語だけど、スペルから [asθma] という発音し難そうな音を想像していた。
が、聞かずに貯まっている Nature podcast を消化していたら、どうも [asma] にしか聞こえない発音をしていた。
辞書を引いたら [azmə] だって(有声には聞こえなかったけど)。
ともかく th は発音しないということのようだ。
|
|
posted at 23:53:52
#
|
|
| |
| 2007-09-19
(*)
|
# 寸劇: conditional expression を条件式と訳したら |
|
ある現場であまり Python には慣れてない先輩がデバッグを手伝ってくれています。
先輩: そこの条件式おかしくないか?
後輩: (動揺して)え、コーディング基準で条件式は使っちゃだめって言われてますが
先輩: (意味を量りかねて)何?
後輩: えっと…
先輩: (もう一度言えば何とかなるだろうと)だからそこの if 文の中の条件式
後輩: この条件のことですか? 条件式じゃないですけど
先輩: (ややキレ気味に)条件を表している式を条件式って言っちゃ悪いのか?
後輩: (ようやく事態を把握して)いや、あの、Python では条件式というと A if C else B という条件実行の構文を指すので…
先輩: はあ?
後輩: いや、あの、すみません(俺の所為じゃない!)
TSPython での会話から発想
|
|
posted at 19:01:36
#
|
|
| |
| 2007-08-20
(*)
|
# kosher |
Do so now after making sure /etc/locale.gen is kosher
とかいうメッセージで glibc 2.6.1 の emerge が止まった。
kosher?
(of food, or premises in which food is sold, cooked or eaten) satisfying the requirements of Jewish law.
Oxford American Dictionaries
ブタとラクダは食べないというあれのこと?
いや、まあそんなわけはない。
figurative genuine and legitimate
同
比喩的に、清く正しいことを言う、と。
ともかく、エラーメッセージに宗教的な単語を使うのは間違っていると思う。
|
|
posted at 00:00:16
#
|
|
| |
| 2007-03-28
(*)
|
# interface |
207:~/Projects/pythonjp/doc_jp/lib% egrep 'インタ(ー)?フェ(イ|ー)ス' *.tex > interfaces.txt
208:~/Projects/pythonjp/doc_jp/lib% egrep 'インターフェース' interfaces.txt | wc
117 243 10030
209:~/Projects/pythonjp/doc_jp/lib% egrep 'インタフェース' interfaces.txt | wc
272 616 21187
210:~/Projects/pythonjp/doc_jp/lib% egrep 'インタフェイス' interfaces.txt | wc
5 9 380
211:~/Projects/pythonjp/doc_jp/lib% egrep 'インターフェイス' interfaces.txt | wc
44 79 6252
一つの文書(Python ライブラリリファレンス)なのに統一感がないな。
多数決なら「インタフェース」になるのか。
ちなみに普段自分自身は「インターフェイス」って書いている。
|
|
posted at 15:09:04
#
|
|
| |
| 2007-03-22
(*)
|
# Guido van Rossum |
|
の読み方が判らないから日本語版ウィキペディアに項目がないのか!
目にしたことのある表記↓
- ホイド・ファン・ロシュム
- ホイド・ファン・ロスュム
- ホイド・ファン・ロスム
- グイード・バン・ロッサム
- グイド・ヴァン・ロッサム
- グイド・ヴァンロッサム
個人的には上から二つめがカタカナ表記では一番オランダ語の発音に近いのではないかと思っているが、綴からの判断なので間違っているかもしれない。
|
|
posted at 21:13:52
#
|
|
| |
| 2007-02-09
(*)
|
# 今日の思い付き |
その1: 画像圧縮
「犯人の特徴は」
「眼鏡を掛けていて、口髭がありました」
とか言って似顔絵を描くのは一種の画像圧縮だ。
再現性を上げるにはどんな語彙を持てばいいのか。
文脈に依るな。
その2: 漢字変換
文脈といえば、漢字変換は文脈を知らずに変換するから大変だ。
24時間視界と音声を(頭にカメラとマイクを装着したりして)収集して言語情報に置き直したものを変換エンジンが利用できたら間違いは減るだろうか。
(いわばその1の応用編)
その3: 文法
文法の解析などをするときは文全体が最初から与えられていると考える。
現実には文は前方から生成されていく。
情報を与えながら状況を限定し、意味を削り出す。
文法は情報の使い方を指示することでこのプロセスを円滑に運ぶ手助けとなる。
|
|
posted at 19:18:40
#
|
|
| |
| 2006-12-12
(*)
|
# 内包と外延 |
|
微妙に受け取り方が違うものだなあ。
細かいこというと「ナニを内包しているので?」という感想を持たないでもないのですが、そういうこと云い出すとまた語が長くなってしまうので引っ込めます。
リスト内包表記 → 内包リスト @ときどきの雑記帖 リターンズ
「内包リスト」は専ら「集合の内包的定義」という時の内包を意識しているわけで、「内包する」という意味合いはほとんど考えなかった。
今までリストが [1, 2, 3] のような外延的定義だったのとの対照しての用語法だから、敢えて言えば今までのリストを「外延リスト」と呼び直してもいいぐらいだ、と思う。
|
|
posted at 10:16:48
#
|
|
| |
| 2006-12-10
(*)
|
# 内包リスト |
|
長くなりそうなので、先にまとめを言ってしまう:
「リスト内包表記」の代わりに「内包リスト」と言おう。
では改めて。
祖母の命日に墓参りの後、足を延ばして秋葉原へ。
ザ・コンで「実践Python」を手に取って、ぱらぱらとめくって眺めていた時のことだ。
だいぶ後ろの方に「リスト内包表記」と「ジェネレータ式」が縦に並んでいるところがある。
同じ長さだ、と思うとともに「リスト内包表記」は無駄に長いなあ、と感じる。
list comprehension を訳す時に、「リスト内包」では収まりが悪いから「表記」と、つまり構文糖衣だという主張も織り交ぜて落ち着かせたと考えられる。
長くて当然である。
そういえばジェネレータ式のPEPを訳した時に「ジェネレーター表現」と訳したのも「リスト内包表記」とのバランスを考えた結果だったような記憶がある。
逆に言うと「ジェネレータ式」と訳すなら「リスト内包表記」はもう少し軽くなって欲しい。
といったようなイメージを一瞬で通り過ぎて、じゃあ「内包リスト」で良くないか、という結論が飛び込んできたのだった。
前後を逆転させることで、結局のところリストであるということが強調される。
悪くない訳語だと思うがどうだろう。
ではジェネレータ式は、式であることが重要なのか、ジェネレータであることが重要なのか、というと、ジェネレータであることの方が重要そうだ。
それならこっちも「式ジェネレータ」の方が?
という主張は自分でもそれほど説得力を感じていない。
そもそも「ジェネレータ」という訳語が…というのはこの前書いた(八百万の神々)ので省略。
結局「実践Python」は買わなかった。
|
|
posted at 17:32:00
#
|
|