工学博士の起業・投資ブログ ~山根光は眠れない~

工学博士の起業・投資ブログ ~山根光は眠れない~

就職できない博士・ポスドク問題の渦中で起業を志した工学系研究員の奮闘記です.
日本社会では必要とされないらしい博士という立場を活かして起業する手法を模索し,社会実験レポートとして書いていきます.
専門はWebデータマインニングと自然言語処理(NLP).

Amebaでブログを始めよう!


しばらくご無沙汰だったが,ちょっとタイムリーな話題を.
NHKの「クローズアップ現代」でクラウドソーシングが取り上げられていたらしい.

らしいというのも,私はテレビを持っていないので,完全な又聞きだ.

 

なら話せることなどないだろうと思うかも知れないが,実の所,私の研究分野ではこのクラウドソーシングは特に新しくないのだ.

自然言語処理研究では,機械学習を行うための正解データを人手で作ることが多い.

この正解データをクラウドソーシングで作ることが結構前から行われてきていた.

 

クラウドソーシングのクラウドは,最近流行の「雲」の方ではなく,「集合知としての群」の意味だ.

その根底にある概念は,「多くの人が支持するものは正しい」,ということだ.

 

例えば,「ある文章を読んで,そのジャンルを分類する」,というタスク(問題)を作るとしよう.

間違える人も当然出てくるし,曖昧なものもある.(ミステリだが恋愛小説でもある場合など)

 

だが,基本的に,多くの人がその文章をSFだと分類したのであれば,それは正解だといえる.

質が多少低くても良いので,安い価格で多くの人に仕事を頼むのがクラウドソーシングだ.

つまり,一人のプロフェッショナルではなく,多くの素人を集めることで,様々なタスクにおいて正解を導くわけだ.

 

古くからあり,代表的なのはAmazon Mechanical Turk

多くのタスクは,母国語さえできれば,一般の人でもこなすことができるものだ.

Mechanical Turkは基本的に米国内からしか使えない.

日本で多いのはLancersだろうか.かなり色んな仕事があるが,同じく日本語ができれば問題レベルの仕事が大半だ.内職をインターネットでやるようなものだろう.

 

クラウドソーシングが出てきた時,人手でデータを作るのはコストが高いという常識が揺らいだように感じたものだ.

それまでは,学習データとして利用するデータは,人手で作った質の高い小規模データか,

機械的に集めた質の低い大規模データの2択だった.
だが,クラウドソーシングはその中間のデータを提供してくれる.
つまり,そこそこの品質で中規模のデータだ.

 

また,評価に利用することもよく行われている.

主に主観評価が必要となる翻訳,要約,質問応答が対象だ.

機械翻訳ならば,Aシステムの翻訳とBシステムの翻訳はどちらが良い翻訳か?というタスクを作るわけだ. タスクの作り方には工夫が必要だが,うまくはまればかなり楽をできることがある.

 

クラウドソーシングによる成果物は,品質に問題があることが知られているが,

その品質評価を統計的に行う研究も進められている.

代表的なのは次の論文になるだろう.

  • Statistical Quality Estimation for General Crowdsourcing Tasks
  • Yukino Baba, Hisashi Kashima

 

クラウドソーシングはこれからも増えるだろうが,そこで稼ぐのは正直あまりお勧めはできない.

つまり,そこでのタスクは完全な時間の切り売りだからだ.自分の時間以上に稼ぎを生み出すことはない.アルバイトよりも気軽に始められる代わりに,アルバイトよりも実りが少ないことも多いからだ.

 

クラウドソーシングで稼ごうというならば,そのシステムを運営する側に回るのが一番良い選択肢だと思う.もっと様々なタスクを受注発注できるしすてむはこれからも出てくることだろう.



趣を変えて,ビジネスの話を少し書いてみよう.

切欠は,週末に埼玉の行田であった着物イベントに参加させて貰ったことだ.

主催者は熊谷で呉服屋を営まれているきものこすぎさん

ご主人は非常に気さくな方で,着物ド素人の私にも大変丁寧に説明してくださった.

(で,思わず買ったわけだが,それはまた別の話 笑)

 

この,きものこすぎさん(小杉さん)の所は代々呉服屋さんをされているらしいが,

元々は地元で細々と商いをしてらっしゃったらしい.

そこで扱っていたのは礼装としての和服.この多くは絹を使った着物で,

羽織や小物類まで一揃えすると,軽く30万ぐらいになってしまったりもするという.

 

ところが数年前から普段着として着ることのできるコットン(綿)着物を扱うようになってから状況がかなり変わってきたらしい.

綿着物は洗濯機で洗うこともできてしまう程に丈夫で,値段もなり庶民的な価格になる.

仕立てまで含めて数万円で買えるため,安いスーツ一つ作るのと大差ない.

 

30万円は無理でも,数万円なら着てみたいという声はかなりあるようで,埼玉県内だけでなく,

関東圏全域から注文が来るようになったらしく,特に浴衣の注文は待ち行列ができるレベルのようだ.つまり潜在的なニーズはかなりあったということだ.

 

ここのご主人は,この業界をブルーオーシャンだと話していた.

逆に従来の呉服屋のあり方では,どんどん市場が小さくなっており,

反物を作る職人,着物を仕立てる和裁士,そして呉服屋,そのいずれも店を畳む所が多くなっているのも事実のようだ.

 

この話を聞いて,確かに和装を好む人というのは潜在的な人も数に入れればかなりいると思うし,

”着物=晴れ着”という既成概念さえ取り除いてやれば(主に価格の面で),十分に商売として発展性があるのではないかと思った.

 

ただ,私がこれまで主に考えてきた単純なネットビジネスではうまくいかない部分も多い.

着物は仕立てるために,服のサイズを実測する必要がある.ネットで販売して売りっぱなしというわけにはいかない.私がお手伝いできるとすれば,普段着にできる着物が存在することを世に広めて,

興味を持つ人が積極的に着物に触れられる場を増やすことだろうと思う.

それ以外にも何か面白いアイデアがあれば試してみたいものだ.


今日は以前紹介したGlobishについて,もう少し詳細に書いてみよう.

グロービッシュが非ネイティブ英語のことだというのは既に書いた.

(Global+English)が短縮されてGlobishなわけだが,

非ネイティブにとってありがたい(学びやすい,使いやすい)理由を分析してみよう.

 

まず,一番よく知られている特長として,グロービッシュは1500語と,その派生型という,極めて限られた語彙だけで使えるようになるということ.

もちろん,ビジネスで利用しようと思えば,その業界の専門用語は別途覚える必要がある.

自然言語処理の世界で言うところのDomain Adaptation(分野適応)のための辞書だ.

 

中学校で習う英単語は約1000語程度だと言われている.

それが高校で習い,大学受験で求められる語彙数はおよそ5000~10000語になる.

この必要とされる語彙レベルの違いが,高校英語で脱落してしまう理由の一つだろうと思う.

 

だが,本当に日常で10000語が必要なケースは稀だ.もちろん(英語圏の)大学で求めれるライティングではそのぐらい使えなければ文章として拙く見えるとは思うが,ビジネスで使うのであれば,言い回しの巧みさよりも,相手に理解しやすい言葉である方が喜ばれるのは間違いない.

 

我々の研究者の世界でも,良い論文というのは巧みな言い回しに溢れた文章のことではない.

研究の新規性,有用性が最も大事なのは確かだが,次に来るのは研究の内容が十分に伝わること.即ち明瞭性(Clarity)と呼ばれる評価項目だ.このClarityが低い論文は同じ内容であっても評価が低い.専門性の高い文章ほど,伝えることには意識を向ける必要があるのだ.

 

もう一つの特徴は文の構成がシンプルであることだ.

中学英語+α程度の基本的な構文しか使わない.

また一文を15単語程度の短い文に抑えることで,さらに分かりやすくする.

つまり,複文構造を避け,AndやButなどを多用してでも文を分割するのだ.

 

この文分割は話す時の極意とも言える.結果として,本来の英語では嫌われる繰り返しを多用することになっても気にしなくて良いと教える.(Mr Smithをheで言い換えなくても構わない)

 

さらに,自己流のアレンジも導入する.

米国へ留学していた時,私は最初単語レベルでしか受け答えができなかった.

しかし,単語で答えた後に,代名詞を使って補足するという手段を覚えたことにより,

無理やり考える時間を作り出し,会話を続けられるようになった.

例えば次のような形式だ.

 

What did you have for your lunch?

Sandwich. It’s very delicious.

(ランチに何を食べたの? サンドウィッチ.とても美味しかったよ)

 

いちいち例を出して話すほどの内容ではないが,単語でも何でも口に出すことは重要だ.

最初の答えは文じゃ無くても構わない.少なくともそれで起こられた経験は無い.

 

それ他に,Globishには,ビジュアルを使えるものは何でも使うというテクニックがある.

例えば数字などは書いて見せればよい.重要な数字だけでも視覚情報として伝えることで,相手の理解度は格段に向上する.研究発表では,重要な数値をスライドに乗せないことなどあり得ない.

 

これぐらいのことを理解しておけば,あとは本当に習うより慣れろ,ということになるだろう.

Globishの実践は中高生の方が得意かも知れない.いずれこれもフィールドワークをしてみたいと思っている.

Kindle Paperwhite/Amazon.co.jp

¥7,980
Amazon.co.jp

今日のテーマは電子書籍.

Kindleの日本発売に伴い,Amazonのコンテンツが充実してきたことで,電子書籍は着実に市民権を得つつある.私自身も去年からKindleを利用し始めてからというもの,一部の専門書・実用書を除けば,ほとんどを電子書籍として購入している.

 

あまりに簡単に本が買えてしまうことは,便利であり,同時に危険でもある.

私は元々食費より書籍代が高い人間だ.買う本は技術書から漫画に至るまで幅広く,
当然部屋にある本は相当な数になる.しかし,紙媒体の書籍をあまり買わなくなったことで,書棚が溢れにくくなったことはある意味で革命だ(笑)

 

さて,多くの人が既に知っているだろうが,AmazonのKindleストアに本を並べられるのは出版社だけではない.個人でも可能である.これは極めて画期的なことなのは間違いない.

従来の自費出版では限られた冊数であっても,相当な金額がかかり,当然採算が合うことなどまずない.自費出版というのは,早い話がただの自己満足の具現化だ.

 

ところが,Kindleストアでのダイレクト・パブリッシングならば,出版コストはほぼない.

それでいてロイヤリティは紙媒体より遥かに高い.つまり原価が低いため,書籍の価格を下げることができ,それでいて報酬は下がらないわけだ.ざっくりとどれぐらい違うかを考えてみよう.

 

通常の紙媒体での出版の場合,印税は高くても定価の10%程度.

100万円の収入を得ようとしたら,1000円の本を10000冊売る必要がある.

これは結構大変なことだ.口コミで何とかできるにはかなりの運か広報能力が要るだろう.

 

電子書籍の場合だとどうか?

Kindleのダイレクト・パブリッシングはロイヤリティが低いと言われるが,それでも35%もあるのだ.

さっきと同じ100万円を稼ごうとすれば,2858冊で良い.あるいは,本の価格を300円以下(286円)にまで下げることができる.これならかなりハードルは下がる.

 

そしてダイレクト・パブリッシングの魅力の一つはターンアラウンドの速さだと思う.

つまり,ストアに並ぶまでの時間が短いのだ.有益なコンテンツをいくつも持っている人であれば,

一月に複数の書籍を作り,並べることも可能だと思われる.

 

そして,広報活動のことを言うならば,ブログを書いているならば誰でもアフィリエイトの一つや二つつけているだろう.そこで自分の本を売り込めば良い.

さらに,どうしても売りたければ,短期的にでもアフィリエイターを頼めば良いだろうと思う.

できればアフィリエイターに対する報酬はお金ではなく,相互アフィリエイト(アフィリエイター同士がお互いの本を紹介し合う)という形式が望ましい.

 

私自身も高額な情報商材よりは電子書籍の方に今後の可能性を感じている.

機会を見て,実際に電子書籍を製作し,Kindleストア店頭に並べるまでもレポートしたいと思う.


 
Webや本でも多く紹介されるようになって,MetaTraderによるシステムトレードは既に一般的になった.

私も負けじと,突発的ながらシステムトレードのための入門的な何かを書くことにしよう.

懲りずに裁量トレードで負けたので,やっぱりシステムトレードをもっと力入れようというわけだ.

 

FXのシステムトレードで欠かすことのできないツールはMetaTraderだと言うのは多くの人が同意してくれるだろうと思う.

海外では絶大な人気を誇るツールであり,国内のFXブローカーでもMetaTraderをサポートする所が結構出てきている.

 

このMetaTraderは内部でMQL Editorという開発環境をサポートしており,それにより独自のインディケータや,また自動売買システムを開発することが可能だ.

だが,個人的に,MetaTraderのための開発で,一番最初に躓いたのはこの開発環境の使いにくさだった.

 

要するにMQL Editorが使いにくくて仕方なく,事実,そのことが開発意欲を恐ろしく減退させていた.MQL Editorを使ったことが無い人は試してみると良い.

基本的なオートインデントやブラケットマッチ(括弧の対応マッチング)もまともに動作しない.

まともなプログラマなら,この環境で30分も作業すれば,アンインストールしようと決意するはずだ.

 

私も何度かインストールとアンインストールを繰り返した.

思い立って始めたら,あまりの使い難さに嫌気が差して辞める,というのの繰り返しだ.

しかしいつまでもそれでは行くまいというわけで,今ではEclipseのプラグインを使うようになったわけだ. バグは結構多いのだが,それでもMQLで直接開発するより数倍マシだと思う.

 

導入方法は難しくない.

以下は私の環境での設定だ.EclipseはJunoを使っている.

Eclipseの初期画面から,メニューの「ヘルプ」 → 「Install New Software」と押す.

出てくる画面が次の画像.

 

WS000002

 

この画像には既に入力してあるが,Work withに 「http://www.forexcited.net/mqleditor」を入力すると,中央のitem欄に「Uncategorize」が出るので,展開して「MQLEditorFeature」を選択して次へを押す.後はライセンスの同意などをして次へを押していけば,プラグインのインストールが行われるはずだ.

 

やっかいなのはどちらかというとインストール後の設定である.

初期画面から,メニューの「ウィンドウ」 → 「設定」と押して設定画面を表示させると,

この画面にはMQLEditorという項目が追加されているはずだ.

必ず設定する必要があるのは,この中の 「Compiler Preferences」だけ.

 

これはインストール済みのMetaTraderの”experts”ディレクトリと,

”metalang.exe”というMQLコンパイラを選択する必要がある.

例えば私の場合はFXDDを利用しているので,次の画面のように設定した.

WS000006


これだけやってやれば,後はキーワードを何色にするかなどの設定があるだけだ.

自分で試しながら色々いじってみるのが一番早い.

 

使う時には,先にプロジェクトのディレクトリ(コンテナ)だけ作ってやり,

その上で,メニューを「ファイル」 → 「新規」 → 「その他」と辿れば,

ウィザードには」「MQLEditor」の項目がある.作りたいものを選択して,

事前に作ったコンテナを選び,ファイルの名前をつけてやれば良いだけだ.

WS000007

 

コンパイルはメニューから「MQLEditor」 → 「Compil MQL」と選ぶか,

ツールからMQLと小さく書いた黄色いアイコンを押せばよい.

ただ,少しバグがあって,mq4ファイルを選択しているのに,選択してくださいと言われることがある.

この場合は,何でも良いのでファイルを少し変更して(改行したりスペースを入れたり),再度保存した上で実行すれば問題なく動く.

以下はコンパイルした時に表示されるコンソールメッセージ.

 

WS000008

 

 

また,コンパイラ設定時「Copy mql and ex4 to MT4」にチェックをつけておくと,

MetaTraderのexpertsディレクトリにソースとコンパイル済みのバイナリファイル(ex4)がコピーされるので,MetaTraderのStrategy Testorで直ぐにテストすることが可能だ.

 

とまあ今夜は少し偏りのあるTipsについて書いてみました.

これにより皆様のEA開発が少しでも楽になれば幸いです.

 

WS000000

以下は参考URL(英語)です.

http://www.forexfactory.com/showthread.php?t=328326

 

またEclipse以外の環境(エディタ)で使う方法も様々知られているので,

興味があれば以下のまとめサイトで見てみると良い.

けいれん現象の幽玄美よ