1 | 2 | 3 | 4 | 5 |最初 次ページ >>

有意差検定と分散分析

2012-06-01 22:00:15 テーマ:統計 beluga2002の投稿

先日、仕事で訳した文書に統計解析が出てきました。

そういえば以前も統計解析が出てきて、このブログに備忘録的に記事を書いたよなーと思い出し、会社で自分のブログの当時の記事を探してみました。


しかし、端から見たら仕事さぼってブログみてるような感じ。

しかも、ブログや SNS などのサイトは基本的にセキュリティソフトにブロックされるので、「業務の目的でそれでも見る」みたいなボタンをクリックしないと開かないという…。


いや、これ、仕事の一環なんですよ。

と、心の中で言い訳をしながら(別に誰にもつっこまれませんけど)、自分のブログを見ていたのですが。

記事が見つからない!

そうして閲覧時間は延びていき、ますますさぼってる感じに…。


さて、今後、振り返ったときにこの轍を踏まないため、テーマに「統計」を追加して、前回の記事も今日の記事もそれに分類しました。

コレで万事OK。


ということで本題です。


翻訳した文書では2つの Study(1つのバリデーションを2つのパートに分けた感じ)が行われていました。

そしてそれぞれで、別の統計解析が行われていました。


ひとつは平均値の有意差検定、もうひとつは分散分析でした。


今回は、Excel の操作法ではなくて、これら検定の意味をまとめておきたいと思います。


【平均値の有意差検定(Excel では、t 検定)】

これは簡単で、2群の平均に優位な差があるかを確認するものです。

よくある例えで、日本人男子の平均身長とアメリカ人男子の平均身長に優位差があるかどうかを検定する、というものがあります。

方法としては、まず日本人男子100人の身長を測ってその平均をとり(Ja とする)、次にアメリカ人男子100人の身長を測って平均をとり(Aa)、Ja 値と Aa 値の間に優位差があるかどうか、を見るものです。


【分散分析(Excel では、ANOVA)】

分散分析は、3群以上の値に優位な差があるかどうかを確認するものです。

上の例えを使えば、これにフランス人男子の平均身長と、さらに中国人、ロシア人などを比べたいときに使います。

それぞれのペアについて有意差検定を行っても良いのですが、手間がかかりますから…。

(3群間の比較であれば3回(3C2)、4群であれば6回(4C2)、5群だと10回(5C2)等々…)

なので分散分析を使って、一気に検定してしまおうというものです。


ただし、注意しなければいけないのは、分散分析では、「有意差あり」と「有意差なし」という判定しかできず、比較した群間の「どこに」有意差があるかまではわからないのです。

なので、「有意差あり」の結果が出た場合は、それぞれのペアについて有意差検定を行わなければなりません。

それを一気にやってくれる手法として「多重分析」というのがあります。

ただし、これはエクセルには付いていない機能なようです。


さて、分散分析が何かが分かったところで、問題が発生しました。

翻訳を担当した文書では、「A と B、C、D の間に有意差が見られた…」のように、明らかに多重分析的なことをしていたのです。

分散分析だけではどのペアに有意差があるかわからないんじゃなかったっけ?


色々調べてみると、平均値をプロットしてその上下に標準偏差(標準誤差)分のヒゲをつけたグラフを作成し、そのヒゲが重ならなければ有意差あり、というような記述があるサイトが見つかり(家のパソコンで見つけたのではないので、今は分かりませんが…)、そのようなグラフも文書には掲載してあったので、これだ、と思いました。

翻訳依頼者とも相談して、原文通り、「分散分析を行い、有意差を判断した…」と訳すことにしました。


判定基準が分散分析の結果だけに頼っているわけではなかったようなので…。


それにしても、科学論文(実験論文?)の英訳は難しい!

統計解析以外に、実験論文の英語を勉強しないとだめだなと痛感したのでありました。

古き良くなきアメリカ

2012-05-13 17:00:07 テーマ:多読 beluga2002の投稿

今年6冊目(ハルヒを入れたら7冊目)の本を読み終わりました。

まだ5月なのに、調子いいですね!

といっても、今回読んだ本は短めのやつなので…。


Narrative of the Life of Frederick Douglass, an.../Frederick Douglass
¥945
Amazon.co.jp

僕が読んだものと表紙が違いますが(出版社が違うのかな)、フレデリックダグラス自伝です。

フレデリックダグラスは黒人奴隷として生まれたのですが、ある事件(文字というものを知った)ことをきっかけに、白人支配に疑問を感じ、ついには逃亡して自由の身になるのです。

そんな自身の半生を描いた作品がこれです。



文字というものを知ったことで、白人による黒人支配の力のカラクリを洞察し、その支配に疑問を感じて逃亡をするなんて、勇気と行動力があります。

そしてなにより、頭がいい!

頭のいい人大好きです(え



文章も格調高いです(多分。こういうのを格調高いと言うんだと思います)。

1800年代の人なので(それとも宗教家だから?)、古い言い回しもありますが、なんとかがんばりました。

英語の難易度としては、今までベルーガが読破したものの中では最高レベルに位置するかと思います。



単語レベルもさることながら、文学的な格調高い文は難しいです。

表現が凝ってたり、挿入や代名詞が駆使されていて、読みながら文法も追って読んだといった感じです。



なので、理解度が低い気がします(ストーリーを追っただけ的な…)。

内容がなかなかいいので(変な言い方ですが、自分もがんばろうという気になります)、ストーリーを追うだけではなく、内容をちゃんと理解できるように何度か読み直そうかなと思います。



いや、むしろ、日本語を読もうかな…。



ちなみにこの本は、↓この本で紹介されていました。



CD付き 英語達人読本/斎藤 兆史
¥1,575
Amazon.co.jp

この本の著者である斉藤先生の本はおもしろいのが多く、英語学習に関しても一家言ある、といった感じの方で、尊敬しています。





日本語の名詞と英語の名詞

2012-04-27 21:49:59 テーマ:言語学 beluga2002の投稿

英訳をするときにひっかかることは多々あります。

時制だったり、前置詞だったり、冠詞だったり…。

いずれも日本人には難しい文法事項かと思います。


そんな今日も弱ったことがありました。

「設備・施設」をどう訳すか。

よく使われていそうな英単語を思い浮かべて、Facilities/Equipments…ん?

確か equipment って不可算名詞では?

あれ、でも普通に設備とか装置とか(場合によっては機器)って訳してたっけ?

それって、数えられそうな…。

どうして数えられないの?


ということで、可算名詞と不可算名詞について考えてみました。

一般的な英文法の解説には大体、「英語には不可算名詞があります。そのままでは複数形にしたり数えたりすることはできません。云々。例として、watar、information、advice、furniture、laggage …」などと書いてあります。

そして、水は(形がないから?)まあいいとして、家具とか荷物とか数えられるじゃないか~という言い分には、「家具には机、本棚、ベッドなど色々あって、形が決まらないから云々」などともっともらしい解説がつけられてたりします。


そうか、形のイメージのしやすさ…。

水…まあ、形もなにもないよな。

情報…ないちゃないよな。

家具…ない…のかな? 集合体? なにそれ、おいしいの?

荷物…もはや形がないとか言わせない。


と、悩みに悩んだ末にふと思いつきました。

考え方が逆だよ!


つまりどういうことかというと、不可算名詞がデフォルトで可算名詞が異端ということ。

物(名詞で表す対象)は元々、数えなかったんじゃないの?


これは、日本語の計数体型(名詞の性質)を考えて思いついたものです。

順を追って説明します。

まず、家具は数えられるじゃないかぁとか、荷物が数えられなきゃ宅配便業者はどうするだぁとか言いますが、実は日本語の名詞は全て不可算名詞なのです!


大発見(だと思う)なのでもう一度言います。

「日本語の名詞は全て不可算名詞」なのです!


大事なので色も飾りもつけてしまいました。

これ、テストに出るぞー。


学生の頃、「外国人(ここでは英語話者)は一々数を数えてから発言してるのか? 日本語は数なんて関係ないのに」なんて思ったことがある方も多いかと思います。


「日本語は数なんて関係ないのに」


これは裏を返せば、日本語の名詞は全て不可算名詞ということを意味しているのではないでしょうか。


え、でもリンゴ1個とか言うよ?


って言われるかも知れませんが、実は英語の不可算名詞も、「a piece of equipment(装置一つ)」みたいに言うことが可能です。

ここでは、piece という単語が1個の「個」にあたる、すなわち日本語的な「数えられる」なのです。


そう考えると、日本語も英語も(もしかしたら全ての言語は)もともと、名詞は不可算だったのではないでしょうか。

そして一部の言語(英語とか)は数える方向に発達したのです。

「不可算名詞基本形説」とかつけてみたりして。


これは別に日本語が遅れてるとかいうことではなく、日本語と英語は名詞が違う方向に発達したということです。

つまり、英語は、a piece of 式の言い方を発達させるのではなく、名詞そのものを個々に分離して考えて数をつける方向(two apples とか)に発達しました。

その一方、日本語は名詞そのものは変えず、単位系を発達させて、数を表すようにしたのです。


確かに、日本語で名詞を使うとき、具体的な物をイメージしないですよね。

例えば、新築マンションの内覧会で、「家具がないからイメージしにくい!」って誰かが言ったとして、ないのは何がいくつでしょう?

なーんて考えませんよね。

なんとなく、居間には机と椅子とテレビ、寝室にはベッドと本棚と…ってイメージするかも、程度で。

その発想が不可算名詞的なのです。

そう考えると、不可算名詞がスッキリしてしかも扱いやすくなりました。

不可算名詞は日本語的に気楽に使えるのです。


その代わり単位を気にしてくださいね、って感じで。

コップ一杯の水→a glass of water

一枚の紙→a sheet of paper

しかも、

がない!→I have no money!(money? moneis? とか考える必要なし)

とか言えます。


この発想をすると、動詞の呼応、冠詞とかも今までと違う見方で理解できそうです。


これに関係したお話はまたおいおい出てくると思います。


ベルーガ式英文法と呼ぼうか(笑)


もうやってる人いたりして…。

ベストセラーラブロマンス

2012-04-22 20:41:08 テーマ:多読 beluga2002の投稿

もう5年以上前になりましょうか。

家族の誰か(誰だったかさえ忘れた)が、アメリカに旅行に行きました。

その時、買ってきて貰った本がこれ。


True Believer/Nicholas Sparks

¥677
Amazon.co.jp

買ってきて貰った当時は読み切れずワンオブツンドクになっていました。

そんな彼は「5年前に途中まで読めたんだから、今度は読み切れるだろう」と栄えある今年4冊目に選抜されたのでした。

あらすじは、科学ジャーナリストの主人公が幽霊が現れるという噂のある田舎の街を、真相を暴くために訪れ、そこで素敵な女性と出会って云々。って感じです。

ラブロマンスです。

ダメダメな内容説明ですが、(当時)ベストセラーだった作品なだけあって、最後まで飽きずに読むことができました。

内容は紆余曲折がありましたが、何となく最後はハッピーエンドになるだろうという感じの本だったので、安心して、そして、紆余曲折の場面にあっては、「ここからどうやってハッピーエンドに持って行くんだろう?」って思いながら読みました。

これ、主人公を夏のキャンプとかで田舎を訪れた東京の高校生、ヒロインをその田舎に住む美少女(高校生)とかにして翻案したら楽しいかも、とナードな妄想もしながら楽しみました。

英語レベルは、大人向けの原書にしては比較的優しい方かも知れません。

多読の一冊にはオススメです。

並べるだけでも違いが

2012-04-12 07:36:53 テーマ:ブログ beluga2002の投稿

法令や契約書など、正確性が求められる文書を翻訳するときによく話題になることがらに and と or の訳し方があります。


正確性を確保するため、英文を直訳し、and、or はそれぞれ「及び、並びに」、「又は、若しくは」と訳せばいいことになっているようです(及びと並びに、又はと若しくはの使い分けについては、インターネットで検索してみてください)。


ところが、英文をそのまま、構成も変えずに並べた場合、正確に読まれなくなる可能性があるように思います。


というのも、直訳した日本語ではすんなり頭に入ってこないからです。
すんなり頭に入ってこないのであれば、正しく理解できない可能性があるのは自明ですね。


ということで、正確でかつ読みやすい訳はどうすれば達成できるか、考えてみることにしました。


それでは、and や or を使った色々なパターンを検討してみましょう。


まず、最も簡単な A and B、A or B というパターン。
これは、どんなときでも A 及び B、A 又は B と訳して特に問題ありません。
(及びが並びにになる、又はが若しくはになる場合などを含む。以下同じとする)


次に A, B, and C のような場合です。4つ以上並べる場合も含みます。
これは、何が並ぶかによって工夫が必要なことがあります。


まず、要素が全て単純な名詞の場合は、直訳で問題ありません。
「赤、青、及び黄」とかですね。
「バス、タクシー、及び電車」とかでもそうです。
なぜかというと、日本語は「及び」を使わず、単に名詞を並べただけでもリストアップになるからです。
「信号は、赤、青、黄がある」
「そこにはバス、タクシー、電車で行ける」


次に、要素が全て動詞(あるいは形容詞などの用言)である場合です。このときも直訳で構いませんが、並べる要素のうち、最後のもの以外は「まだ続きますよ」ということが分かる形に活用させると良いと思います。
つまり、「製造する、検査する、及び出荷する…」よりも、「製造し、検査し、及び出荷する…」の方が、「製造し」までしか読んでないときも「あ、まだ続くんだ」と分かります(動詞の羅列を「及び」でつなぐのは若干違和感がありますが。その場合は、「かつ」や「また」などに直しても良いのかもしれません)。


最後に、大きなまとまり(文や句)が並ぶ場合があります。
この場合は上記に順次、文や句の最後が用言であれば「続く形」に活用させます。「山に登り、海で泳ぎ、また川で遊ぶ」のような感じです。
もっと長くても特に問題はないようです。


また、句が名詞で終わる場合も、「歩いて上れないほどの高い山、足がつかないほどの深い海、及びそこが見えないほどの汚い川」のように特に問題はないようです。


ただし、体言(名詞)で終わる句の中で気をつけなければならないものを少なくとも一つ見つけました。それは、条件が並列されるときです。


どういうことかというと、Aの場合、Bの場合、Cの場合…のいずれか、のようなときです。このとき「Aの場合、Bの場合、及び(又は)Cの場合」とするとスムーズに読めなくなります。なぜかというと、日本語で、「Aの場合、」という文(句)が目に入ると、反射的に次は、「どうする」という主節が続く、と思ってしまうからです。


英語の場合もそうなのですが、英語の場合は、「if (when) A..., if (when) B...」のように次の塊も条件を表すことが句の先頭に明示されるので、順序どおり読んでも思考が中断されることがありません。


ところが日本語の場合はこんな感じの思考の流れになってしまいます(括弧ないが読者の思考)。
「AAA の場合、(AAA の場合はどうするのかな?)BBB(BBB するの?)の場合、(あ、これも条件だったんだ)及び CCC の場合(まだ条件が続くのか)、XXX とする(やっとどうするかわかった)」


この場合、BBB のところで確実に思考が中断されます。


この思考の中断を防ぐ方法は、「A の場合」の後に「や」という一文字を入れることです。即ち、
「A の場合や B の場合、及び C の場合、…」
どうでしょう?
前に戻らず読むことができますよね。


最後に補足ですが、日本語で語や句を列挙するときは、「及び」や「又は」にあたる言葉(接続詞)は列挙される語や句の第一番目の要素の直後に入れるのがもっとも自然です(この辺は、本多勝一氏の「日本語の作文技術」に詳しく書いてあります)。


したがって、上記折衷案は実は結構中途半端です。
厳密な直訳が要求される場合は、上の話は無視して「A、B、及び C」とするのがいいかもしれませんし、読みやすさ重視の自由度の高い訳文であれば、「A や B、C」などのように、自然な日本語にするのがいいかもしれません。


それっぽく「及び」や「又は」を使うことが求められながら比較的制限の緩い翻訳が許されるときに応用できます。
比較的自由な訳が許される際にも応用できるとは思いますが。

Amebaおすすめキーワード

    1 | 2 | 3 | 4 | 5 |最初 次ページ >>
    アメーバに会員登録して、ブログをつくろう! powered by Ameba (アメーバ)|ブログを中心とした登録無料サイト