library-1147815_640
1: ガーディス ★ 2019/05/14(火) 12:26:34.27 ID:Dd/F8ptD9
古文書や浮世絵などに書かれた「崩し字」を、人工知能(AI)が画像から解読するシステムを立命館大文学部の赤間亮教授らのチームが、凸版印刷(東京)と共同開発したと13日、発表した。

 チームによると、同様の解読アプリなどは他にもあるが、AIの導入は全国初という。

 システムは、立命館大が所蔵する古文書や浮世絵など約76万件のデータベースと、凸版印刷が保有する崩し字を蓄積したデータをもとに開発。パソコンの画面に映った文書で読めない文字を1文字選択すると、崩し字データの中から形が似ているものをAIが抽出し、合致する可能性が高い文字を順に表示する仕組み。

no title

http://news.livedoor.com/lite/article_detail/16453138/
9: 名無しさん@1周年 2019/05/14(火) 12:31:14.53 ID:rbiIq/m50
赤短あのよろし

13: 名無しさん@1周年 2019/05/14(火) 12:37:09.17 ID:Y42coFpN0
古い登記簿が読めるようになるのか

16: 名無しさん@1周年 2019/05/14(火) 12:37:33.67 ID:LuxJ5DRa0
なんでもAIって言えば言いと思うなよ。

3: 名無しさん@1周年 2019/05/14(火) 12:28:29.90 ID:ObSdJG4/0
草書とかただのミミズがのたくった字にしか見えない

17: 名無しさん@1周年 2019/05/14(火) 12:39:04.65 ID:NznFxE990
学者「げっ、わいの唯一の特技が無効になるで」

10: 名無しさん@1周年 2019/05/14(火) 12:31:22.13 ID:SVvbtco20
江戸時代の三陸の地震、伊達家の文書を読めた歴史学者等は知ってたけど
読めなかった地震学者は知らなかった、とかいうのがあったんだっけ

19: 名無しさん@1周年 2019/05/14(火) 12:41:06.02 ID:pvf7hkMS0
江戸時代中期以降の庶民向けの本は基本的に漢字に全部振りなが振ってあるので
くずし字のイロハが読めるようになるとほとんど判読できるようになる
あとくずし字のイロハ覚えるのはアルファベットより簡単

20: 名無しさん@1周年 2019/05/14(火) 12:41:20.98 ID:C+6k5hVy0
江戸のくずし字入門なんて本買ったけど、崩し具合の幅が広すぎてすぐ挫折した

28: 名無しさん@1周年 2019/05/14(火) 12:53:54.08 ID:cCOVV/TP0
右筆が書いたような綺麗なくずし字はちょっと勉強すれば読める
だけど、江戸時代の庄屋や商家に残ってる書状なんかは酷い
何通も比べながらなんとなく読み進めていくうちになぜか読めるようになるんだが、AIを活用すると言うのはこういうことができるようになるということなのか

右筆 - Wikipedia
右筆(ゆうひつ)は、中世・近世に置かれた武家の秘書役を行う文官のこと。文章の代筆が本来の職務であったが、時代が進むにつれて公文書や記録の作成などを行い、事務官僚としての役目を担うようになった。執筆(しゅひつ)とも呼ばれ、近世以後には祐筆という表記も用いられた。
39: 名無しさん@1周年 2019/05/14(火) 13:39:04.84 ID:hU97Ilth0
筆で字を書くことからああいう崩し字に必然的になったんだろう
あれが読めるのは文章がワンパターンだったからだ

58: 名無しさん@1周年 2019/05/14(火) 17:48:00.70 ID:lWKFKIh90
>>39
そうなのか?
江戸時代の庶民向けの印刷物、瓦版とか草子物とか春画のキャプションとか、そっちのが好まれるからと、わざわざ崩し字で木版を彫って刷ってたというよ。
楷書で書くと、お寺の経文やらお役人が橋のところに掲げるお触書とかみたいでお固いから嫌がられたんだとか。

79: 名無しさん@1周年 2019/05/15(水) 08:48:23.40 ID:5/5ryT0I0
>>58
楷書だらけの現代の文章は仮に内容がアホアホだろうと字的に江戸の人からしたら超お固いってわけか
ポップ体さえ緩く感じないってなんか不思議だな

40: 名無しさん@1周年 2019/05/14(火) 13:39:50.66 ID:8JAxMirn0
くずし字の何が面倒かというと、元字の漢字が同じ
ひらがななのに、何種類もあってどれをクズしてひらがなに当ててるのか見て覚えないといかんところな。
慣れるしか無い。
漢字の候文の方が読みやすくて意味が取れる。
スタンダードには価値があるってことだな。

44: 名無しさん@1周年 2019/05/14(火) 14:30:38.59 ID:cCOVV/TP0
>>40
それに手癖が合わさるから読めないのは本当に読めない
帳面とかはいいけど、書状のような私信は結構厳しい
江戸後期から明治ぐらいが厳しい

48: 名無しさん@1周年 2019/05/14(火) 14:59:25.28 ID:L/490Xie0
>>44
手癖を手癖として認識できないAIはどんどん変な学習をしていく
ちゃんと手癖として分別してくれるんかね

56: 名無しさん@1周年 2019/05/14(火) 17:09:12.77 ID:FrbNWdNw0
>>48
その辺はかなり興味あるな
史料の原本じっくり見て墨の濃淡から書き順で判別したりするからそういうのができたりするとすごい

70: 名無しさん@1周年 2019/05/14(火) 22:43:17.22 ID:yoa02b750
こういう虱潰しはAI大得意だから良さげ

45: 名無しさん@1周年 2019/05/14(火) 14:38:30.27 ID:ndVHYNl20
「’」みたいなので「カ」だったりするからな
一字だけより連続する何字かで候補出してもらう方が有難い

72: 名無しさん@1周年 2019/05/14(火) 22:48:34.49 ID:4gBEE9kH0
定型表現で「候」の文字は何度も使うから、みんなめんどくさがって「丶」になってるのは笑った。

75: 名無しさん@1周年 2019/05/14(火) 23:02:21.83 ID:FrbNWdNw0
>>72
だってあんな字画多いのいちいち書いてられへんやんw

8: 名無しさん@1周年 2019/05/14(火) 12:30:17.91 ID:qW+HKzT50
戦国時代の書状とか受け取った人どーすんのこれみたいなのもあるな

25: 名無しさん@1周年 2019/05/14(火) 12:46:58.75 ID:lWKFKIh90
>>8
ヨーロッパ中世の文書とか、崩し字でない上にラテン語だから使われてる字の種類が23なのに、さっぱし読めんよ

31: 名無しさん@1周年 2019/05/14(火) 13:10:56.96 ID:1Sv8qLGz0
>>25
ドイツのヒゲ文字も読めん。

73: 名無しさん@1周年 2019/05/14(火) 22:49:29.59 ID:1ys2N3A90
アルファベットの崩し字はマジわからんな。
あれネイチブは読めるんか?

61: 名無しさん@1周年 2019/05/14(火) 19:06:18.65 ID:xCSRYnKr0
日本の古文書はカッコ悪い
西洋の羊皮紙のギリシャ語とかラテン語はカッコいい

62: 名無しさん@1周年 2019/05/14(火) 19:34:06.47 ID:4aMC9K2u0
>>61
日本は庶民も文書残してるからね。西洋の貴族と坊主の残したものと比べたら、そりゃ見劣りする

55: 名無しさん@1周年 2019/05/14(火) 16:59:03.39 ID:+jUqE9Lc0
こういう草書体や変体仮名が多用されるのって近世・近代ぐらいまでのイメージが強いけど、昭和の年金の古い台帳を見ると崩し字や変体仮名が使われてるケースが結構あるよ
その結果が5000万件もの年金記録問題を生み出したけどw

56: 名無しさん@1周年 2019/05/14(火) 17:09:12.77 ID:FrbNWdNw0
>>55
史料整理してた経験からすると戦後しばらくまではわりかし普通に使われてたような印象を受けるな

21: 名無しさん@1周年 2019/05/14(火) 12:41:32.58 ID:vVg7pSC50
AIが古文書読めるようになったら画期的だな

24: 名無しさん@1周年 2019/05/14(火) 12:44:40.85 ID:o6c5m3b60
読める専門家が少なくて研究が進まないからねぇ
今はデジタルアーカイブ化で閲覧可能の資料も増えたし

今までは専門家が所有者の許可とって読むしか無かったけど

30: 名無しさん@1周年 2019/05/14(火) 13:10:48.03 ID:7zfPAjhE0
こういうことされると俺の爺ちゃんの仕事がなくなって困るな・・・
平安朝や江戸期の古文書の解読で長年頑張ってきたのに
便利になるって誰かが犠牲になるもんなんだな

32: 名無しさん@1周年 2019/05/14(火) 13:12:19.08 ID:1Sv8qLGz0
>>30
技術論における昔からの課題だ。

47: 名無しさん@1周年 2019/05/14(火) 14:57:22.98 ID:L/490Xie0
>>30
いや、その成果がAIとして継承されたんだろ
AIそのものは先人の成果が無けりゃなんもできん
AIからすりゃおまいさんの爺さんは神そのもの

23: 名無しさん@1周年 2019/05/14(火) 12:44:29.34 ID:Gl3lnsO90
不都合な真実が解読されてしまうかもしれない。

15: 名無しさん@1周年 2019/05/14(火) 12:37:21.03 ID:FSxAL3OT0
こういうのが欲しかった


転載元:https://asahi.5ch.net/test/read.cgi/newsplus/1557804394/
このエントリーをはてなブックマークに追加

人気記事ランキング

    おすすめ記事(外部)

     

    コメント

    コメントフォーム
    評価する
    • 1
    • 2
    • 3
    • 4
    • 5
    • リセット
    • 1
    • 2
    • 3
    • 4
    • 5
    • リセット