◎正当な理由による書き込みの削除について:      生島英之とみられる方へ:

日本語処理技術者の憂鬱


動画、画像抽出 || この掲示板へ 類似スレ 掲示板一覧 人気スレ 動画人気順

このスレへの固定リンク: http://5chb.net/r/prog/1537503146/
ヒント:5chスレのurlに http://xxxx.5chb.net/xxxx のようにbを入れるだけでここでスレ保存、閲覧できます。

1所長2018/09/21(金) 13:12:26.69
こんな状況で、日本の自然言語処理技術が
育つわけがねぇだろう!

…… というので、立ててみました。

2所長2018/09/21(金) 13:17:56.35
日本語の文法は知的所有権の保護対象にならない。
アルゴリズムは知的所有権の保護対象にならない。
辞書は著作権の保護対象にならない。
だからトレード・シークレット(企業秘密)に
属すから外に漏らしちゃダメ。
プログラムは法人著作物だから、著作権は
企業に帰属する。

そんなんで日本の自然言語処理技術が
育つわけがねぇだろうがよ。

みんな海外の企業に利権を押さえられて、
それでいいのか?

3仕様書無しさん2018/09/21(金) 14:34:23.28
>>2
なら5ちゃんねるで愚痴ってないでどうにかしろ

4仕様書無しさん2018/09/21(金) 14:35:39.29
日本に不満がある
だけど名前を明かして語るほどのやる気はない
そんなんで何かを変えられるわけがねぇだろうが

5仕様書無しさん2018/09/21(金) 16:02:20.90
>>3
さんざんやってダメだったから言ってんだよ。
アスキーも、
アップル・コンピュータ・ジャパンも、
ダメだったから言ってんだよバカヤロウ。

6Mb2018/09/21(金) 16:14:50.45
>>4
> だけど名前を明かして語るほどのやる気はない
> そんなんで何かを変えられるわけがねぇだろうが
あぁ? 誰に喧嘩売ってんだよ。
所長のメアドは >>1 に書いてあるんだよ。
文句あるんなら、井芹 昌信さんとか 大村皓一さんとか
(ついでに、会ったことないけど 西 和彦さんにも)に、
「島田正雄([email protected])」まで
連絡よこせ、って、言っといてくれや。

7仕様書無しさん2018/09/21(金) 16:42:39.56
でラズパイは?

8仕様書無しさん2018/09/21(金) 17:25:20.74
>>7
食卓の下の足下に転がってる (笑)
今年の猛暑で出歩くのが面倒臭いのと
Linux(つーか unix)についていちいち
勉強すんのがしんどくって、鯖立てる
気力がなかった(つーか、そんなこと
やってたら死んでた)んだわ。
けっきょく、RedHat 系のフリー OS であるところの、
CentOS かなんかにしようかなー、というあたりで
止まってるんだが、とにかくハードがないと
動くモンも動かんので、いまのところ大掃除の
最中。

9仕様書無しさん2018/09/22(土) 21:54:21.31
あらすじ
・6/13夕方
 所長がスレを立てる
 「自鯖を立てたいんだが」
・6/15夜
 6/13〜15とAWSだのSaaSといった今風の意見も出るが、ラズパイ決める。
 この辺りは名無しなので所長かMr.Motoのどちらが対応しているのか不明だが、
 話の流れでも1から人が入れ替わる要素がなく所長であると推測される。
・6/16日中
 九十九に行く。ラズパイを購入。アスペを告白。
・6/17日中
 ラズパイで Linux + Java + Tomcat 構想を語る。
 夕方のレスでの会話内容からこの辺りの名無しはもうMr.Motoだと推測される。
・6/18夕方
 暴露話をしていることを咎めた相手に特定可能な会社名と実名を挙げて
 なぜか他人批判を始める。この辺りから偽装請負の個人事業主なのかの
 議論が始まるが、雇用の用の字が違うだの言いだして必死で逃げ出す。
 結局逃げ続けて逃げ切る。医療系の専門用語の理解がめちゃくちゃ疑惑も
 この辺りから始まる。
・6/18夜
 あまりの論理飛躍っぷりにこのあたりでこいつの中身は35歳説が囁きだされる。
 「でサーバーを立てる話はどこいったんだ」っていうのが逃げの一句として
 定番化したのもこの辺り。ここでMr.Motoというコテハンを名乗る。
 Mr.Motoの名乗りだしたあたりで医療系に詳しい設定に加えて
 漢字変換システムのエキスパート要素が加わる。
・6/19
 この日は準体助詞について熱く語る。

10仕様書無しさん2018/09/22(土) 21:54:50.80
・6/20
 謎の出典を明記して何かを引用することで説得力を持たせるスタイルを
 実践しだす。
 能力の疑惑に対してhttp://2chb.net/r/tech/1477625280/
 で宿題出せば答えると能力をアピール。このスレを出した時は
 俺はできるやつだと解釈しろという意味と思われる。
 (そこまで追ってないし落ちてるようなので実のところは不明)
 昼、再びラズパイの構想を語る。この時点でもちろん立ち上げていない。
 夜、パッケージマネジャも知らないことが判明。先が思いやられる。
・6/21
 「元ネタは所長氏」の一文からMr.Motoは所長ではないことが明かされる。
 ようやくSDカードを買ってきた模様。
 クリニカルパス論争はこの日勃発。
・6/22
 Mr.Motoの由来を語りだす。
・6/23
 モニタにつなごうにもケーブルがないことに気づく
・6/24
 ラズパイとモニタのUSB同士つないだら映らないかなとか言い出す
・6/25
 ネットワークログインすればいいとようやく理解したように見えるが
 昼にテレビを買ってきて度肝を抜く。
 どうやら病名を聞くだけで個人が特定されるレベルの超レア難病らしい。
・6/26
 ブートに挑戦するもテレビには何も映らず。敗戦。

11仕様書無しさん2018/09/22(土) 21:55:31.16
・6/27
 LEDから状態を推測することを学ぶ。
・6/28
 ラズパイのSDカードスロットが壊れやすいのがいけない、みたいな
 ことを言い出す。ようやくLEDから状態が推測して故障と判断、
 夜に新しいのを買ってくる。
・6/29
 TOIECの点数議論が始まる。スタートはすごそうなことを言っていたけど
 確認され続けた結果英語に自信がない日本人像が完成する。
・6/30夜
 インストール成功の第一報。
・7/1
 いきなり所長登場。Mr.Motoとのあまりの違いのなさに周りは困惑するも
 別人という事らしい。

ここまで前スレのあらすじ
http://2chb.net/r/prog/1530428664/

12仕様書無しさん2018/09/23(日) 01:14:51.11
>>11
自然言語処理とやらのスレを見てきたけど、所長とかmotoとかは同一人物が脳内別人格設定で書いているだけみたいに見える。
自然言語処理の中身についても、机上であれこれ理屈を捏ね回しているだけて実際に何か作った実績があるようにも思えない。
大学でちょっとかじった学生あたりが、その後拗らせておかしなことになっているのかな。

13M.B.2018/09/23(日) 13:50:00.09
>>12
> 自然言語処理の中身についても、机上であれこれ理屈を捏ね回しているだけで
> 実際に何か作った実績があるようにも思えない。
構文解析に関しては、「机上であれこれ理屈を捏ね回しているだけで
実際に何か作った実績があるようにも思えない。」という批判は甘んじて
受けよう。ただし、形態素解析に関しては、なんか分らんが「おれらに
勝てる奴がいるんなら教えてくれ(笑)。行って潰してくる」
的な勢いがいまだに続いている。ホント、日本の自然言語処理技術者は
しっかりしてくれよオイ (T_T)
> 大学でちょっとかじった学生あたりが、その後拗らせておかしなことに
> なっているのかな。
(日本で最初にワードプロセッサを作った)東芝が、J-3100 用に
「パソコン用のワープロソフト」である『言の葉』というのを
作ったんだが、おそらくは「誤変換が多すぎて、他者のワープロソフトと
対抗できない」という話になったらしく、東芝から「ワープロソフトの
誤変換をチェックするプログラムは作れないか?」という話になった。
で、西新宿の特に名を秘す某「エー・アイ・テクノロジー(株)」
(仮称です。実在の法人名とは いっさい関係ありません。本当にありません。
“ない”って言ってんだろ!)に依頼が来て、そのシステムを納めたついでに
某プラットフォーム Mac(仮名)上で「r-Stone JE」(もちろん仮名)を
開発・発売したという経緯がある。

14Maria2018/09/23(日) 15:53:58.44
>>12
> 自然言語処理とやらのスレを見てきたけど、
> 所長とかmotoとかは同一人物が脳内別人格設定で
> 書いているだけみたいに見える。
国語学とか記述文法に関しては所長、
語彙論については あ・た・し、
標準的な実装に関しては M.B. 、
ハッカー的な技法については Moto ちゃん、
という切り分けができているんですが、
「仮に、これを一人でやってるとしたら、バケモノだ」と
業界では云われていて、とりあえず「何人いるんだ?」に
関しては、ヒ・ミ・ツ ♡
じつは M.B. と Mb とあたしは ほぼ同一人物なんだけど、
部署が違うメンバーとの合同ペンネームです。

15Maria2018/09/25(火) 12:29:21.95
ところで。
辞書ファイルのフォーマットに関して、誰か積極的な
意見はあるのかしら?
そもそも、「辞書」に関する著作権は、どういう扱いに
なっているのかしら?
そのあたりが いいかげんだから「静」と「靜」とか、
いろいろ「それは、うちの辞書をパクったろう!」みたいな
話に かかわるイヤな話がいっぱいあるのよね。
あんたたち、日本語処理とか やってて、実際どう思ってんのよ!
そのあたり、ハッキリさせて欲しいんだけどね。

まぁ、自然言語処理をやってる方々による、質問事項には
真摯に お応えしますけど、ねっ!

16仕様書無しさん2018/09/25(火) 12:56:12.46
>>12
学術の先端なんてキチガイの集まりだから、
もし多重人格だとしてもあんまり驚きはないな。
多重人格としては性格も記憶もほぼ同じみたいだから
なんか別の発達障害系の症状なんだろう。

17仕様書無しさん2018/09/25(火) 15:22:31.50
>>16
> 学術の先端なんてキチガイの集まりだから、
で、あんたは学術のどのあたりにいるの?
『ハムレット』を読んでから いらっしゃいね?

18仕様書無しさん2018/09/25(火) 17:23:07.52
>>16
確かにそれぞれの人格?に大した違いはないし、かと思ったらとってつけたようなキャラ設定したり…。
なんちゃって多重人格か、誰も相手してくれなくて独り議論ゴッコでもしてるのかなと思う。

19仕様書無しさん2018/09/26(水) 00:36:19.66
>>17
IETF76広島大会でWIDEの一員として3つほどのWGのホストをさせてもらったくらいですね。

20Maria2018/09/26(水) 10:53:32.33
>>16
> なんか別の発達障害系の症状なんだろう。
発達障害者(つーか、障礙者)ではあるけども、
「症状」ではないかな。乖離もないし(もっとも、
あったとしても記憶してなかったらおんなじか (w)、
自己同一性障害でも境界性パーソナリティ障害でも
ありませんしね。
えー、いちおうあたしは辞書管理担当ですが、
過去に某企業でやっぱり辞書の管理をしていたことが
あって、そのときその会社が他社の辞書をコピーして
使っていたことに気づいてしまい(「靜」と「静」とか、
「力」と「カ」とか、ビミョーに識別用の文字が埋め込んで
あったりしたんですよ)、そこを退社して以来、「どこかの
誰かさん」で通しています(まぁ、自閉系の集まりには
ときどき顔を出しているので、そっち方面では正体を知って
いるひとは多いんですが)。
辞書っていうのは著作権におけるグレーゾーンでありまして、
かつて新明解の「親亀」の辞釈にスゴイのがありました
(まぁ、日本語処理をやってる人には常識だろうけど)。
で、うちの所内には「トレード・シークレットの保持」に
関する凶状持ちがゴロゴロしているので、所長以外は
だいたい正体不明というコトになっています。

21Maria2018/09/27(木) 13:36:52.41
とりあえず、
・版権フリーで使える辞書
・精度の高い形態素解析ができる品詞分類
・機械的処理ができて、人間が読みやすいフォーマット
・いわゆる辞書順に整列できるとかいった、ツール群
・それらをフォローするような公的な組織
とかいったものを整備する必要はあるんじゃない?

言っちゃなんだけど、日本相撲協会なんかより、
こっちの方がよっぽど重要な気がするんですけど。

22Maria2018/09/27(木) 13:41:44.54
つーか、文化庁とか内閣府とかは、何をやってるのか
判んないんですけど、ひょっとして認知症のヒトタチの
介護施設かなんかなワケ?

23Maria2018/09/27(木) 13:55:03.67
そういえば、貴乃花引退に関して、内閣府が相撲協会に対して
「全ての親方は、五つある『一門』に所属しなければならない」と
決めたっていうんですけど、そのエビデンスって、どこにあるんでしょうか。
「内閣府からの通達」として、公文書が残っているんでしょうかね?
特命担当大臣や内閣官房長官は、何をやってるんでしょうかね?
行政が、「難しいことはワカンナイ」みたいな奴を甘やかしてるから、
真面目に日本語処理を やってる人間が迷惑してるんですよ。
安倍さんが悪いとは言いませんけどね? もうちょっと
何とかなんないもんでしょうか? と思うんですけど、どうでしょう。

>>19 、あんたはどう思う?

24仕様書無しさん2018/09/27(木) 20:46:46.14
相撲はどうでもいいぞ

25仕様書無しさん2018/09/27(木) 20:51:54.12
>日本語の文法は知的所有権の保護対象にならない。
当たり前だ

>アルゴリズムは知的所有権の保護対象にならない。
当たり前だ

>辞書は著作権の保護対象にならない。
嘘をつくな

26仕様書無しさん2018/09/28(金) 02:41:44.35
>>25
>>アルゴリズムは知的所有権の保護対象にならない。
>当たり前だ

なるだろ

27Maria2018/09/28(金) 14:17:53.38
>>25
> >辞書は著作権の保護対象にならない。
> 嘘をつくな
辞釈は保護対象に なるようですが、
パクられて訴訟を起こしてもムダでーす(笑)
元ネタをパクったのはいいけど、「じつは元ネタが
間違ってましたぁ〜(笑)」みたいな話がありまして、
それが、新明解(たしか、第三版)の「親亀」の辞釈で
「親亀の背中に子亀を載せて、子亀の背中に孫亀載せて、
孫亀の背中に曾孫亀載せて、親亀こけたら、皆(みな)
こけた」と揶揄されていました(笑)。
で? あたしらが嘘吐(つ)いたって いう文句あるんなら、
いくらでも かかって らっしゃぁーい?
歓迎するわよぉ〜?

28仕様書無しさん2018/09/28(金) 14:25:21.05
>>26
カーマーカー特許のことを言っているなら正しい。
だけど、日本ではソフトウェアの権利保護に関して、
「著作権法による保護」と、
「特許法による保護」と、
「ソフトウェアの権利保護のための、新しい保護法」を
制定しようという話があって、そこいらで喧嘩している間に
バブルがはじけちゃったんで、そのあたりは
曖昧なんだ。
で、そのあたりで民事訴訟を起こしても、そのあたりを理解している
裁判官は いないので、訴訟費用だけで赤字になっちゃうんだ。

そのあたりの話があるんで、このスレが立ったという経緯が、
正直なところ、あるんだわ。

29仕様書無しさん2018/09/28(金) 14:34:31.98
>>24
「国が所管してるんだから」とか言って
和解に応じない奴がいて、
裁判所から「相手の弁護士が『依頼人の所在が
わからないので、向こうの敗訴になりました』」って
言われて、訴訟費用が持ち出しになったりするんだよ。
貴乃花関は、そういう「おれは正しいのに、なんで国は
おれを いじめるんだ (T_T)」みたいな思いを、
いっぱい してるんだなぁ、というのが理解できているので、
同情はしている。

知的所有権に関する法制を、ちゃんと整備しないと、
日本語処理の未来は暗いぞ?

30仕様書無しさん2018/10/05(金) 16:50:35.29
>>29
なんか知らんが、貴乃花親方
(引退しちゃったから親方じゃないんだろうが)が、
テレビで見たら、すげぇスッキリした表情を
していて、ちょっと感動した。

31仕様書無しさん2019/01/17(木) 10:36:52.18
著作権法にアルゴリズムは含まれないだろ。
あくまでも特許法で開発したアルゴリズムに対して保護する。
だからただの一般的なコードなんかコメント外して難読化、書式整形されたらもう誰のものかなんて分からないんだよな。


lud20190703121330
このスレへの固定リンク: http://5chb.net/r/prog/1537503146/
ヒント:5chスレのurlに http://xxxx.5chb.net/xxxx のようにbを入れるだけでここでスレ保存、閲覧できます。

TOPへ TOPへ  

このエントリをはてなブックマークに追加現在登録者数177 ブックマークへ


全掲示板一覧 この掲示板へ 人気スレ | >50 >100 >200 >300 >500 >1000枚 新着画像

 ↓「日本語処理技術者の憂鬱 」を見た人も見ています:
四大ブラックだと思う公務員の職種「学校教師(教員)」「自衛隊員」「情報処理技術者の公務員」あと一つは何だと思う?
情報処理技術者試験って
情報処理技術者試験の手当
情報処理技術者試験は無駄
【ワカヤマン】情報処理技術者能力認定試験
実用英検と情報処理技術者(応用、基本)の難易度
【*^o^*】情報処理技術者試験 総合統一スレ
情報処理技術者試験 高度試験共通午前T Part3
【情報処理技術者試験】iTECとTACどっちがいいの?
【IPA】情報処理技術者試験は本日18時出願締切!急げ!
【ワカヤマン】情報処理技術者試験 高度総合 Part1
主要資格の難易度を情報処理技術者試験(基本情報技術者など)で換算するスレ
【IT】明日はIPA情報処理技術者試験です 自分は諦めました…
日曜日はパソコンの大先生の試験ことIPAの情報処理技術者試験なわけだが
本日、宅建と情報処理技術者試験が行われる 宅建の合格予想点は36±1点
情報処理技術者試験の合格発表!土方モメンは高度合格したよな?
4月15日は情報処理技術者試験 合格目指すケンモメンは勿論余裕だよな?
日曜日は基本・応用情報など情報処理技術者試験の試験日です 全然勉強してねえ
9歳がIT系の国家試験、「基本情報処理技術者」に合格 IPA「明日からでもシステム開発ができる」
「今日は情報処理技術者試験だ。頑張るぞ」IPA「試験会場が水没したので変更しました(張り紙)」
高校生が情報処理技術者試験「エンベデッドシステムスペシャリスト試験」に合格 「実務経験がない高校生の合格は珍しい」
【悲報】春期「情報処理技術者試験」中止
情報処理技術者試験ってどうなの? [無断転載禁止]
【*^o^*】情報処理技術者試験 高度試験共通午前T
明日情報処理技術者試験を受ける嫌儲民 [無断転載禁止]
情報処理技術者試験は時代遅れ。不要。 [無断転載禁止]
情報処理技術者試験 総合統一スレ 3 [無断転載禁止]
アホ「情報処理技術者試験は役に立つ」 [無断転載禁止]
【ファイト*^o^*】情報処理技術者試験 総合統一スレ 3
情報処理技術者試験は何故こんなに難しいのか [無断転載禁止]
情報処理技術者試験 高度総合 Part1 [無断転載禁止]
【社会】4月17日の情報処理技術者試験、実施中止を九州全域に拡大
【IPA】情報処理技術者試験 総合スレ part4 [無断転載禁止]
情報処理技術者試験 高度試験共通午前T Part3 [無断転載禁止]
【ファイト*^o^*】情報処理技術者試験 総合統一スレ 2 [無断転載禁止]
【FE】基本情報技術者試験(旧・第二種情報処理技術者試験) Part464
【価値】なぜ情報処理技術者は易化したのか【減少】 [無断転載禁止]
IPA、春期「情報処理技術者試験」などを中止 司法試験はどうすんだ?
【自粛】社畜が申し込んで当日サボりまくりの情報処理技術者試験、中止へ
【TOEIC】過大評価または過小評価されている資格【日商簿記/情報処理技術者/宅建士】
【サーティファイ】情報処理技術者能力認定試験【1級/2級第1部/2級第2部/3級】
「日本のIT技術者の中には、アメリカに行けば年収数千万稼げるレベルの人間がゴロゴロいる」 ⇐これマジ?
日本での技術者の待遇が悪いから技術者がヘッドハンティングされるんだ!←違くね?
【日韓】韓国が日本の原発技術者のスカウトに猛進…そして、韓国で相次ぐ原因不明の原発事故[11/01]
【環境】汚水処理に日本の技術=環境悪化歯止めへ−印[05/04]
【難関国家資格】今年4月の基本情報技術者試験に合格したけど質問ある?【IT・情報処理】
【FE】基本情報技術者試験合格者だけど、情報処理系の資格の難易度ランキングを作ったよ!!!!!【ITパスポート】
基本情報技術者試験合格者だけど、情報処理国家試験の難易度を大学受験で換算してみたよ!!!!!!!!!!!!!!!
ポーランド「日本は高度な技術力はもとより『日本人の精神』などあらゆる面から“立派な国”。日本語を学ぶ若者が大変多い」
1級舗装施工管理技術者
2級舗装施工管理技術者
電気管理技術者 part 8
【通称】建築物環境衛生管理技術者 109棟目【ビル管】
【通称】建築物環境衛生管理技術者87棟目【ビル管】
【通称】建築物環境衛生管理技術者 96棟目【ビル管】
【通称】建築物環境衛生管理技術者 90棟目【ビル管】
IT技術者不足でアジアの学生を日本に。移民推進
東芝、ベトナム人技術者100人を日本人と同じ待遇で採用。
統計不正のプログラムの技術者が既に死んでるって日本やば過ぎない?消されたのか?
中国「日本人の技術者を常務取締役にし、リストラされた数万の技術者を全てうちが貰い受ける」
北の非核化、日本が技術者派遣を検討 福島第一原発の事故対応などで蓄積された知見を役立てるらしい
【人手不足】日本企業、IoTやAI活用で大きな後れ 深刻な技術者不足 高報酬で外国人材募集
01:19:44 up 13 days, 2:23, 1 user, load average: 9.56, 10.92, 21.59

in 0.01252007484436 sec @0.01252007484436@0b7 on 012615