日本語規格用語
古い記事の中に、JISとは、ISOとは、UNICODEとは何か、
まとめて書いている場所があった。小渕首相が生きておられた
年のようだ。今でも通用する記事かどうか分からないが、
読んでみた。以前、インドネシアの友達に会社のパソコンから
メールを送ったら、文字化けして読めないと言われた。
家の自分のパソコンからメールをしても、文字化けして読めないと
いう。携帯電話の細い方の字ではなく、太字の文字を使うと読めるという。
だけど、yahooのチャットでは、どこのパソコンからでも読めると言う。
「どういうこっちゃ?外国と日本では、アルファベットでも通用
しない文字があるんだな。」と、思ってインドネシアにはパソコンから
メールはせずに携帯電話からメールをすることにした。日本のパソコンを
外国に持っていった友達とは普通に文字化けせず読める。
当たり前か。ある人がインドネシアに送ったメールが読めないと、わたしに
連絡が来たので、「文字化けしているそうだよ。」と教えると、言語の設定を
変えたら相手が読めるようになったと言っていた。
意味不明だったが、パソコンには世界仕様の文字と日本仕様があるという
ことだけは分かった。わたしのパソコンはどうやったら、世界仕様の文字に
変わるのかな?携帯電話からのメールで十分用が足りているので、
ずっと、そのままになっている。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
JIS [Japanese Industrial Standard]
日本工業規格。日本工業標準調査会が調査を行い、通産省が認定する。国内のみ通用するがISO,ANSIの順に世界権威規格の下位規格の宿命にある。そのため泥縄のように末尾に年号がついた修正事案が多い。 JIS規格原案は電子工業振興協会(電子協)という天下り外郭団体に業務委託して作成させるか業界諸団体に丸投げしてそれに権威をつける作業から生み出される。本論でJISと書かれているのは狭義のJIS形式と総称される日本語規則全般の意。 (JIS X201,X208-83,-90,-97,及びそれを受けたISO-2022-JPを指し示す)
ANSI [American National Standard Institute]
米国規格協会。本来USA国内のインターフェィス標準化を行う団体。現在ほとんどお飾りで動いていない。機構まるごとISOに移行とも言える。メンバーほぼ一緒。またはANSI策定された機能コードを含めたASCII256文字拡張欧文符号を指すコト多し。
ASCII
[American Standard Code for Information Interchange]
ANSIが定めた情報交換用米国標準コード。アスキーと読む。7bit。35機能コード+94文字コードで構成。某有名出版はここより名を取る。実質現在の世界通信符号の標準である。亜種としてISO 646が存在しオマケで各国独自記号を12個だけ容認している。例えば\マークやCマーク。これに通産省が安易に拡張した半角カナ障害が加わりASCIIが日本では通らないというおかしな現象がおこる。AT互換機がNEC国民機を駆逐した構図がここにも見える。
ISO [International Organization for Standard]
国際標準化機構。名実ともに世界標準化団体の頂点にある。結構流行らなかった通信規格等も規定しているが、一応標準規格の世界権威であるためここ数年企業の技術屋さんはISO9000だとかいって苦労しているほど。(最近ではエコマークと勘違いしてるヒトもいるが)現在INETで”ISOが”という場合は実際にはIECの活動を指す。
IEC [International Electrotechnical Commission]
国際電子技術標準会議。 ISOが2度と外れた規格を作らないようにと、ISO電気通信特化部門として近年独立活動している標準化委員会。ここの試案が実質世界標準になることが多い。ほとんどISOの諮問機関もしくは業界オピニオンリーダーである。
JIS形式
日本語を工業符号化する際の標準化規格とその符号全般を示す俗称。
何度かの改正により実態形式が変わってもJISで定めたお国の文字としての名称にこだわった為、JIS形式と言う場合に具体的にどの文字符号系規約を示すのか判断できない。よって簡単な説明ができず、誤解と混乱を生む。厳密な場合、その起案番号をもって呼称するしかない。が、さらにその規約及び改正案ごとにFONTだけ、コードだけ、追加漢字だけといったように記述内容が異なり非常に分かりづらい。(せめて統合整理して廃番規格ぐらい作ればいいものを。責任問題を恐れて抹消できない。大学官僚システムの腐敗構造縮図なハナシである。) JIS C 6226-1978が最初の規定であり、これら初期規格を旧JISと通称する。主に80年代に電算機日本語処理の乱立を阻止するため電子協内部の言語標準専門委員会(90年解散)において研究された。しかしJIS X208-90 までJIS形式といえど各メーカー別に拡張開始文字コードがマチマチで互換性がなくまったくのザル規定であった過去を持つ。(現在でもPGPやストリーミングを行う際にインコードが異なるJIS文章でトラブルが起こる。SJIS変換が絡んだりするとESC(BとESC(Jが混在するようなJIS形式が出来上がる。お馬鹿なことにこれでもJIS97には適応 )日本政府の建前では日本の国語の工業通信規格はコレのみとしている。「JIS形式」というと多分JIS X208-90以降を示しているのだろうが旧規約も廃番でなく一部生きているため、JIS規約名で呼称すると不明瞭かつ猥雑なコレである。古い規格という認識を払拭するべく 1997年にSJISとUCS2を盛り込んだJIS X208-97がコレらの最新規約にあたる。(でもJIS批判論争とかいう漢字種増設論議がおきた。当論はコレとは論旨がまったく違うので注意。)
旧JIS形式
初期AXや初期東芝製品(日本初ワープロ等)に実装された機種依存する文字規格。現在のJISとは異なりInCodeも規定されておず、各社ごとのコードと文字形を対応させただけであった。(現在はなんとかInCodeは2種類まで淘汰)多くの官公庁の漢字装置というシロモノはほとんどコレ準拠であったりする。破綻銀行のコボルシステムでもないといまや滅多に見かけない日本語符号系。と思ったが住基ネゥトソフトで堂々と対応しているところを見ると、役場レベルでは、まだまだ現役なのかもしれない。
新JIS形式
現在JISといえばこれを指す。多分JIS X208-90以降の規格群をいっているのだろうが、ドレから”新”なのか厳密に説明できる人間は少ない。(どれとどれがとも)さらにややこしいコトに'99年にUNICODEをにらんだというか明朝計画というか新JIS X 0213-2000というアナウンスはあり、それだけを指している場合もある。(orあった) InCode規定してからを新JISと見るコトもできるが。多くの場合、新JISといった場合には実装コード形式でなく”常用する漢字群” といった”SJISの常用漢字”な意味で文脈使用されているようだ。しかし専門家は漢字割付等 改定が多く新JIS形式と言うと個別例外が多く具体的でないため JIS X208-97等の起案番号を使わざるを得ない。概念用語ともいえる。(これがJISの分かりづらい原因)
JIS X201
JIS X201-1976。致命的な不整合規格。半角カナ参照。
日本の恥部。
JIS C 6226-1978
日本で最も古い公的日本語工業規格。旧JISと俗称で呼ばれる化石規格。ただし、日本語のためではなく、いまや死滅した JIS CというANSI C日本語化言語策定の為であった。
JIS97
いわゆる現行のJIS文字コード。正式名称はJIS X 0208-1997 XP、W2K,OS-X時代の日本語コード規定。6,879字。もはや社会的には常用漢字の代わりとなる指針か?当然管轄は法務省でも文部省でもなく通産省。新JIS形式を参照
JIS2000
JIS X 0213-2000の俗称。省庁再編前の最後の大仕事で無理やりSJISとEUCとISO-2022JPの整合性を持たせようと、これでもかと実装付属書を”参考”としてつけまくったツギハギだらけのJIS97上位拡張規約。合計11,223字。電子政府構想突入対応のつもりらしくInet対応を謳うがただの修正バグフィクス以下の泥舟なシロモノ。始めて字形=FONT形状にも触れ、包摂できる人名漢字に言及。 Unicodeに収納することを考慮し異体字量を減らす方向に180度転進。(またも前任者の失策を見ないフリで、延命ツギハギ)ちなみに現在の中学教科書は全てJIS2000で表記できることとされている。(教科書をあわせるのかJIS2000を合わせたのか?ドチラが初めにあった意図なのか不明)
SJIS形式 [Shift JIS Code]
JIS形式の問題であった漢字増量とinCODEにESCコード(1B)を統一して当てたかなり複雑な言語符号。現在のトコロMAC、IBM、NEC各社に機種依存文字があり多くの漢字は一応、互換性を保っているが、 INET標準のEUCとの差異は問題となっている。 JISに対しては上位規格として機能し(文字割当に限る)吸収しつつあり、ついに最新JIS規定ではSJISの拡張部分をも認定している。パソコンでは国内標準100%であるため、PCブーム以降日本の7割の文章が SJISである。CPUから見ると汚いというかウラワザな構造をしている(それゆえに”特殊な日本”鎖国が可能であった)。もともとはCP/M日本語化の産物。
現在ブロードバンド時代最大の欠点は、字幕として、逆再生ができない無規則不定サイズ文字列であることである。汎用性とそこそこの文字種、一番汚いコード構造で現在、日本の主流文字コード。
EUC形式
[Extended Unix Code]
拡張UNIXコード。(UNIXで使われる文字コード体系を全世界で使うために拡張された規格。)おもにMIT、バークリ両校と全世界UNIXハッカー有志により取り決められているらしい。日本語部分の文字セットはJISとIBM漢字(SJIS)の折衷でなされており、DATAとして見た符号は JISに近い。それを指してAT&T JISともいう。拡張SWとしてESCシーケンスをINcodeに用いOUTcodeは存在しない。それゆえ拡張というよりモードによる多言語実装と言えるかも。モード部を見つけ出せば全角日本語モード中の文自体はJIS構造になる。よってWIN95Jでは EUCのConvertは存在せずJPN2022.TRNによってEUCを処理している。(ただし半角日本語モードも存在しその文中はSHIFTJIS.TRNとISO88591.TRNで処理される。)
日本語部分の源規格となるものは公的機関にはなくATT通信文字規約に基づきボランティアの日本人ハッカーによってUNIX ContributeとしてJIS規約群にしたがった技術文章がUNIXアーカイブに散逸するだけだ。(Hacker規格ですな。心臓部だけメーカーモノのUNIXもありますがいまやUNIX自体が特定メーカ製品ではないHackerOSですから。Linuxとかはまるごと手作りなのに多くの企業、政府団体のサーバーで実動してます。そちらの方が性能が上なんですね。ウン千万のメーカUNIXより。) 余談だが、ということは ハッカーを犯罪者と定義した警視庁では摘発対象なのだろうか?(各県警にハッカー対策班というのを作ろうとしたが流石にINET自体を犯罪者とみなす意味を指摘されてサイバーテロ対策室になりました。総務UNIXのhack.txtというEUC技術文書をやっと読んだようです。ああ先進国。)現時点ではINETサーバーの7割近くが採用。
UNICODE
ISO/IEC による世界統一文字規格。正式規格はISO/IEC 10646と言い、この規格案が投票認可された'92年あたりからその中の一部のコード体系を”商品的”にUNICODEと呼んでいる。UCS2が実際の”正統”規格名。最大の特徴が文字セットを各国まかせでなく最初から規定しておくことにある。これにより国際化製品がどこでも作れる、同一画面内多国語表示を行える。と劇的進化が見込めるためMSが熱心に推進している。この規格に従えばデータもプログラムもローカライズの必要は無い。大きな問題点はただ一つ、既存文書コードと互換性がない。 CJK言語が最初から実装されているとしても当のアジアでは”文化的経緯”問題、Convertに伴う諸問題が有りいまだ決着がついていない。(IE4で日本語入力できないとのトラブル。OSがSJISであると決め打ちしているOLSを使った後などによく聞くバグ(仕様?)である。)いずれは移行しなければならない世界常識であろうが、いかんせん規定されていない穴がまだ山積されている。1文字が必ず16bit=2byteで符号化されており、(UCS2規定部分。UTF-8では8bit) 文化的経緯無視のもときわめてシンプルに0000からFFFDのコードに6万5536文字セットを割り付ける。(ちなみに10646には32bit版も規定されてこちらUCS4は実装文字数は 429億496万7296個。)既にWin95でUCS2は内部機能しているが”文字セット不備”なため全世界コードと言う意味ではまだ動作できてはない。(IE5をOPTIONで導入して面割りをすると作動する。) JIS X 0221-1995に詳細あり
2002秋での最新規約はUnicode3.2。 なおMS社Win2000以後XPでも実装はunicode2.0どまり。
ISO/IEC 10646
Information technology-Universal Multiple-Octed Code Character Set. と題されるBasic Multilingual言語の規格。ここにUCS2として規定されいる部分が俗に現在ではUNICODEと呼ばれているものの文字配置規格(コードページ)である。 10646と言う場合はこのUCS2を指し下賎な商業規格UNICODEではなく理論部分であると主張するフクミがある(らしい)。 UNICODEを参照
UTF-8
[UCS Transformation Format 8]
8bit転送用互換重視Unicode。1文字1から6バイトの可変長符号。英語以外のアドレス (URL) をサーバーに送信可能にする技術。既存規格との非互換UNICODEをASCII部だけ互換にした規格。英語圏のエゴというやっかみの声もある。UTF-7というさらに英語圏だけ互換性を強めたモノも7bit版も最近はある。通信の常識である8bitバス幅とサイズの点からInet空間ではUCS2文字を1から3byteの8bitバイナリに圧縮して使おうという提案。 JavaやHTML5以降での採用が決定。これを実装すれば
http://小渕恵三.政治.日本 というようなURLアドレスが可能になる。
(現時点国内ISPでは、ほぼ対応。ただしinetの混雑を生むのであまりしないように。)すでにMS系サーバーでは使用できる。NTTとBT&MCIの合併もコレの戦略。いやぁ女性大臣だと扱いやすいやとMSKKのオエライサンが言ったとか。いいのか文部省。郵政にあんなコトさせて。
UTF-16
[UCS Transformation Format 16]
1文字2もしくは4バイトの可変長Unicode。普通Unicodeといえばコレ。必ず2バイトセットで扱えるため、字幕逆回転が可能。次期マルチメディア標準文字コード規約。モートロラvsインテルのレガシーCPU戦争の遺産から 2バイトの並び方(byteOrder)が2つあり、LEとBEとよばれ区別される。(リトルエンディングとビッグエンディング)これ以外にUTF-16では文字化けは発生しないが、現在もMacOSではUTF16BEを吐き、WinはUTF16LEを吐くのでマルチメディア系使用では注意が必要である。
UTF-32
[UCS Transformation Format 32]
1文字4バイト固定Unicode。Unicode3.1で策定。字幕逆回転を意識した過剰拡張規格。256x256の面しか持たない地球上字形では半分も使わない。単に逆回転で文字検索等処理が狂わないという機能用途で使用される。LEのBE指定ヘッダを付加して上位互換を持たせると事も可能。
CJK文字 [Chaina-Japan-Koria Characters]
MS始め海外ソフトハウスが困っていたアジア2byte言語の業界用語。産業界としてはUNICODE導入によりアジア市場が一まとめで処理できる利点がある。特にこの3ヶ国文字はPC処理上最大の懸案対象だった。 ”CJKは同一アジア”が起こる文化的火種にもなる。
ISO-2022-JP
INETメールに代表される通信文書packetにつける宛先等の規定。 Headerと呼ばれる識別子を必ずpacket通信にはつける必要があり、 JPはその世界規格であるISO-2022で例外的に2byte言語を使用する際の記述に現れる日本語規格を指す(一種の全角JIS)。ISO2022のJP使用時例外の意でISO規約ではない。 原則InetPacketにはASCIIの83文字のみ認められているが、題名に限りJISの全角領域の一部が猶予され Inet空間では内容領域ならどの形式でも問題無いがHeader領域は いかなるシステムも日本語はISO-2022-JPに変換し送信する(ハズ)。例外として、よく聞くのはMSのIEでは非Inetでの使用を考慮してこれを無視できる設定がありSJISのまま日本語題名を発信する”よいこ”がサーバーを落としまくった事例がある。策定研究した日本INET母体の名をとりJUNET形式と呼ばれるコトもある。なおMS社製のMAILではなぜか守られかった。(”かった”と過去形に最近なりました) UTF-8の出現により追われる立場になってしまった。 (2022-JP-2つーのもありますが.. 下手にISO8859と韓国KSC、中国GB、記号であるJIS補助とか文字拡張をしてしまいメーラーレベルで互換性ありません) 誰にも先が読めないINET文化行政での唯一の日の丸。発案署名者は村井純氏。(現慶応大学環境情報学部教授) RFC1468を参照
RFC1468
InetMAILに関する日本語等2byte言語の使用の規定。 RFCから始まる技術文書はINETに関する様々な規格を記述している英文であり、1468は日本INET空間の母体であったJUNETの村井純氏によって署名記述された日本語使用に関する論考及び規定である。これにより唯一許されている日本語はISO-2022-JPだけである。(Contentは何でも可だが、荷札に半角カナは不可!)最近は海外の画面付き携帯電話との不整合もあり、世界的に MAIL悪化しているのにRFC1468に従わない半角カナ題名を日本だけ鎖国状態で行っている。 ISO-2022-JPを参照
ISO-2022-JP-2
ISO-2022-JP(全角JISの一部)に GB 2312-1980(中国文字セット) KSC 5601-1987(韓国文字セット) JIS X 0212-1990(JIS補助漢字) ISO 8859-1(西欧圏文字セット) ISO 8859-7(ギリシャ文字セット)を加えたマルチ言語伝送規格。RFC1554で規定。はっきり言ってUnicode台頭により”死んだ”規格。 ISO2022JP対応メーラーと非互換ゆえ使わない方が無難。
半角カナ
JIS X201-1976で最初に規定された情報交換用符号の字形とコードセット。現在ではEUCとSJISのみ存在する A1-DFの領域に割られたカタカナ。 (EUCでは頭に拡張シーケンスコード8Eがついて2byte)原典によれば7bit,8bitにそれぞれ2種文字セットを割り4つのコード使用を考慮規定した通信符号である。これが通信で決して使ってはいけない文字コードのデビューであった。誰も責任をとらなくていいお役所仕事としていずれ教科書に載る自虐なシロモノである。 "2バイト情報交換用符号化文字集合"規格 JISX208-97でも「JIS X 0208で規定されている文字は、全てのコンピュータで読むことができる」と大ウソを書いています。これは半角カナを先例主義で実態を見ずに認めたから。(JIS形式の半角自体は1990年廃止されたがSJISとEUCに残る)通信に向かない理由は世界常識7bit符号の特殊機能コードとコンフリクトするためである。昨今IEがSJISでしかも8bit送信可能な設定ができるため問題が深刻化している。どうコロンんでも2年内に使用禁止が”お上”から告示される危険なコードであり、抹消すべき存在である。 Win98JではUIのつくFontを使い、見た目半角に内部変換している。さて半角キーなしの105keyはいつ発売?
OpenType
マックの最後の砦 印刷業界を崩すために98年MicroSoftが放つとどめの一撃。 AdobeのAcrobat実用段階システムにしてMSでDirectFontと呼ばれていたプロジェクト。もともとWindows NT内部のUNICODEフォントデータは、約1750 字の MS標準キャラクタセットしか持たないため日本語文字集合としての UNICODE使用はできなかった。(Fontには利権と著作権が埋まっている) MS-Adobeの提携でPS Fontが使えるこのキラーアプリで全て産業にWinをというGateの野望は果たされることとなる。 13,791 文字分しかないMSに42億9496万7296文字セットをうめるチカラはない。できるのはFontメーカーだけである。しかも世界文字文化制覇のできる規模の。 AdobeのFont実績からしてそれは可能だ。いまや日本印刷業界でAdobeなしで仕事のできるのはリョウビやモトヤといった専業Font屋だけかもしんない。世界の全ての新聞雑誌のシステムにMS-Adobeが食い込む戦略でもある。Gate氏の頭に666。←(これは、聖書にある預言で、世界の終わりの時には、世界の宗教統一をもくろむ大淫婦、カトリックを担ぎ出して登場する世界平和を実現するが実際には全世界に設置したしゃべる像(パソコンのことだと思われる。)で世界中の人間を支配する、ローマの独裁者(イタリア)が 、全世界の人間のひたいに666の数字を入れると言う聖書の預言を示している。666とは、たぶん6桁の数字×3のIDコードのことだと思う。Gate氏は、聖書の預言を実現していくひとりになったと言いたいのだと思う。by日本のお姉さんの補足)
INcode
ASCIIに対して拡張概念で日本語を扱う際、ここから漢字文字列であることを示す目印になるコード。 EUCでは6種のESCシーケンス(EUCは拡張ではなくモード移行という概念)。 SJISではSI/SOと呼ばれるコードで日本語部を括る。
国語審議会
昭和9年設置、昭和24年(1949年)GHQにより強制改組された国語改善機関。必要に応じ(よくわからんが)政府に建議する。それ以前には国語調査委員会という国の機関があった。(どーやら国語審議会は”国の機関”ではないらしい。単に学閥で東大閥が文部省とナニなだけのようだが?)
当用漢字
1946年(昭和21)国語審議会の答申に基づき政府が告示した「当用漢字表」の1850字の漢字。 2年後当用漢字音訓表・当用漢字別表(教育漢字)など泥縄にオプション規定が出されたが結局常用漢字に全て吸収されることとなる。(GHQ基本は現在も基本である)当然、新聞、文壇からの反対はあったが言論統制時代から脱せず、無言の抵抗で体面を繕うのみであった。なお、真っ向から反対していた逓信省(現NTT部門)は逓信人名漢字(約5300文字。現NTT人名外字)を固持。そのためか1949年(昭和24)GHQ指導により逓信省は郵政省と電気通信省に分割された。この5300文字と法務省戸籍用漢字284字がこの後SJISとして民間発芽する。(NEC漢字とか)法規自体は1981年常用漢字表により廃止宣言された。
常用漢字
1981年国語審議会答申に基づき鈴木善幸内閣が出した 1945字の漢字。(95字増やすのに35年。)歴史的には当用漢字よりも古い常用漢字表というのも存在し(1923年国語調査会が作った)これが当用漢字の素となった為、常用-当用-常用と紛らわしい歴史になっている。普通常用漢字といえばこの昭和56に最終改定されたの常用漢字を指す。通産省と違い、事前法令を廃止してupdateしている点は評価できる。広義では同年に発表された「公用文における漢字使用等について」なる規範とあわせて日本公用表記の意で呼称するコトもある。
L10N [Localization]
現地化。(地域化とも)LとNの間に10個文字のあるアレ。 UNIX業界で使われる符牒でHacker's Dictionalyにも載る権威ある専門用語。単に現地設定化すること全般をさす。反対概念に国際化 L18N というのもある。(多言語対応化 M17Nというのも最近ハヤリ)
L18N [Localization]
国際化。多くの場合1byte言語である英語圏で制作したソフトをそのまま世界各国言語仕様で販売できうるノウハウをさす。さらに進んだ目標として多言語処理M17Nという分野があるため、その技術のサブセット的な面も持つ。(現在のL18N主流は言語ファイルをユーザー選択導入。複数同時表示は必要なし)オブジェクト指向時代である90年代にL10Nという”ダマシ”で高価な独占を続けた日本企業(特に国民機を作り日本を10年遅らせた企業)は2000年には L10N流行遅れから国際競争力を失う。これはその国の文化的優位性の指針でもある。現在MSKKの最後のOS商品であるIME2000さえJava版IMEJ5.0(非日本人チーム作)無償IIE5.5添付に押され海外では誰も使っていない。(辞書のみ国産業績?)この国のMS社は唯の在庫管理支社に過ぎなくなるコトを暗示する技術。つい先日この分野の世界最先端であるSunが商用UNIXであるSolarisの国際化技術を無償公開した!。実にめでたい。言語は既に国家管理を離れNETが規定する時代に入った。地球幼年期の終わりは近い。Sun広報参照
結局はすべての人類資産として良いものだけがL18Nされ”消費者をだます地域言語”でアグラをかいたあらゆるダメな”ソフト”文化は淘汰される。
Win98J
'98年7月25日日本発売された(アナウンス発表はMSKKにあらずMS本社)
Windows 4.05の製品名。
日本版だけ入ってないものが色々あることで有名。
(TV業界の圧力でWebTV、CSコントロール関連のモジュールが軒並み削除。)
Win98Jに入っているメーカードキュメント(導入CDのrootにあります)によると
> 標準フォント(MSGOTHIC.TTC, MSMINCHO.TTC)で以下の拡張を行いました。
> 1) 日本語文字セット JISX0212 および WGL4 をUnicodeレンジに追加し、
> 戸籍・人名等の処理における日本語文字不足に対応しました。
> 2) 画面UI専用フォント「MS UI Gothic」を追加、標準UIフォントに採用して
> ダイアログやメニュー、アイコン等ユーザーインターフェースの文字の
> 見易さと見栄えを向上しました。
とのコト。画面UIというのは半角カナ禁止の見た目半角の文字コードのハナシ。 98年中にR2らしきサービスパック追加モジュールが即投入される予定だったが商品として販売しやがった。Win98SE。さらに2000年9月15日にはWin MEなる実態はWindows 4.06に過ぎない BugFixが単独OSとしてパッケージングされ販売される。(サービスパックで十分だせるだけの量しかないのに。)多分商売上手なMSとしてはMSNの大失敗分を山ほど入った広告ソフトで回収する商売上手だろう。なお入れるとリソース使用量win95r2の3倍に膨れ上がり、使うたびにこっそり遅くなっていきます。そこでUSERは新CPUを買うわ、 IDをMS本社に通知するわ、個人情報がダダ漏れでMめちゃくちゃEーやなOS。 (当初の10年戦略にも2年広報にも発売予定には入っておらず、MS_updateですべて無償Upする方針演説があったのに。2002年サポートを打ち切り。 2002年冬段階ではXPを初めとするNT系以外ではMeだけがサポート対象である)
WindowsXP
OS/2から続くマイクロソフト製NTコア32bitOSの最新版。
イヤミで言えばwin9xとは異なる、MicroSoft初の”完全自社開発”OS製品。やっとLINUXなみの機能を搭載。中身はwin2000と変わりなく”全世界をひとつのコンピュータに”というMS.NET構想が強化されたアプリバンドル、見た目”家庭的に”なった(だけの)NTシステム。
完全Unicode内部処理でSJISはレガシー最多遭遇する文字コードとしてデフルトで強制変換される亜細亜辺境の文字コードとして稼動する。したがってアプリによって旧MS仕様のままだとファイル名にSJISとUnicode混在を許す”仕様という名のバグ”が存在する。(つまりMS社にアクティベートして全使用アプリを時々監査させろという設計になっている。いわゆるDLL地獄からの解放と個人管理でも有効)ありとあらゆるUPDATEやシステム障害をNETを通じMSサンノゼ統括で管理することでユーザ-負担をなくすというコンセプトのビッグブラザーな親切設計。ちなみにWin98SE時代から国家使用禁止を打ち出した中国に遅れ、日本政府はXPから日本公務での使用を禁止するようだ。XPは個人情報がMSに漏れるという理由で北海道では住基ネットでの使用が禁止。(正確にはIISとoutlookの禁止)MSKK(MS日本法人)は情報が流出することはないと公式コメントで反論中。(NSAバックドアの存在はWIN98からあったとウワサされ技術的解析サイトも存在するが Yahoo!からシロートにもビンラデインメールが来る時代には一般閲覧できないように圧力がかかる。)アクティベーションというNETを通じた使用者登録認証が大不評ながら、他のOSサポート打ち切りで(ドライバー開発できない)初心者がUSB2等最新技術を一見簡単そうに操作できる(設定は変りはしない。MSが代わりに遠隔設定してくれる)OSはコレだけになった。(現実家電屋で売られるPCは全てXPに)従来からのSJISであるCP932(やっとMS社独自のSJIS規格が公開)を内部で Unicode2.0変換している点はwin98から変わらないが、NT系の強固なマルチタスク独立を使いOSの言語モジュールを解さず、アプリから変換テーブルで直接UnicodeマップをGetし文字処理実現できるうえに多国語表示ができるアプリから識別子別にコールさせコードページ変換という方法がとれるようになった。(win9xのSJIS表示読み書きさえ単なるエミュレートのひとつといえる。) Unicode字形が存在すればフォント表示は必ず出来る仕様に変更された。逆にいえばコード(意味)が先にあるTRON超漢字と反対にまず字形マッピングであるUnicodeという見た目が最初にあり、コードは後から考えるUnicodeマシンになっている。Meまでの9x系では必ず使用言語コードページの定義が必要であり、かつ2byte文字は1つしか表示できなかった1OS 1コード1マップ仕様。それゆえ9x系は中文フォントを入れれば日本語は化け、システムはクリーンインストールしない限りANSIフッカーさえ狂い、ブラウザーレベルな表示でさえ初心者に難しい仕様になっていた。NT4以降からXPまで、表示文字台帳は必ずunicodeFONT (ただし日本版は現在2.0簡易版のようで全世界字形が入っているわけではない)から抜き出すことでコードページ上はいかなる機種の文字コードにもOSレベル対応するに変更されている。たとえば題字はMacintosh文字コード、本文はEBCDIC文字コード、図版内は中文big5というようなテキストもOSレベル対応している。(正確にはNT4以降のシアトルNatural-Languageチーム作成OSは全て)ただし文字コード混在に対応する行単位識別子なり、自動認識なりのカラクリをアプリ側がもっていなければダメであるが。多くの場合、これはXMLの文章構造=意味タグと修飾=見た目タグに集約されていく方向でありプロ用DTPでも無い限り、そこまでの実装をしている例はまだ少ないようだ。(AdobeFrameMakerとかXML組版ソフトだとかが、先行している)
http://www.geocities.co.jp/Hollywood/1751/JISknown.html
~~~~~~~~~~~~~~~~~~~~~~~~~~~
読んでも半分以上分かりませ~ん。パソコンは95とかWIN98Jとか
98MEとか、どんどん変わっていって信用できないなと思っていた。
XPになってから、しばらく次のが出てこなくなったので購入すること
にした。でも、パソコンを買った瞬間に次の新製品が出ていて、
店にいくとわたしのパソコンは古くてダメな機種扱いになっていた
ので悲しかった。
友達に「もう少し待ってから、最新のを買うわ。」と言うと、「そんな事を
言っていたら、いつまでたっても買い物できへん。欲しいと思った時に
買えばいいんや。」と、言っていた。
そういう友達も、SONNYのデジカメ(サイバーショット)を買った瞬間、
手ぶれがしにくい新製品が出てきてショックを受けていた。
マックのパソコンも、買ってすぐに、WinのOSも入っているし、iPodも
使える新製品が出てきてショックだったようだ。
何を買ってもすぐ古くなる。物を買っても、最新の物を買ったという
喜びは長続きしない。そんなものなのかな。
犬の寿命みたいなもので、こちらがのんびりしていたら、IT関係の物は
どんどん古くなっているのだ。気が付けば自分の持ち物は全部、時代に
取り残されているのだ。友達のお母さんは音楽が大好きなので、
いつでもお出かけの時はイヤホンをして音楽を聞いている。
各社のMP3系の商品を新製品がでるたびに購入し、友達に命令して
それに音楽を入れさせている。
音楽を取り込むのは面倒くさいのだそうだ。
友達は、説明書を見ながらお母さんの要求に答えて毎晩音楽を
取り込んであげている。最近は友達のお母さんはiPodに音楽を入れて
歩くのがお気に召されたようで、今までの機械はいらなくなって、
全部人にプレゼントしてしまった。う~ん。わたしも欲しかったかも。
でも、やっぱりもらえるならiPodがいいわ。
消費者はいつの時代でも新しくて使いやすい物が好きなのだ。
でも、わたしは、やっぱりCDの音よりも、レコードの音がきれいだと
感じる。もしかして、CDを録音中にカットする低音が聞こえる人
なのかな。