読者です 読者をやめる 読者になる 読者になる

(ry

(ry という表現がなぜか気になったので、分析してみた

(ryとは (イカリャクとは) [単語記事] - ニコニコ大百科とは

(ryとは『以下略』を意味するネットスラングであ(ry

由来は、『(略)』とタイピングする際に、ローマ字で(ryaku)とする表記かr(ry
つまりこの言葉は略の略で、「わざわざ全部言わなくても(ry」というメッセージが(ry
転じて「(ry」と(ry 
使用する箇所としては、わざわざ言うまでもない・言いにくいこt(ry
しかし、使いすぎるとめいわk(ry
なので、用法容量を(ry

個人的にはまったく使わない表現だけど、言語処理するにはちょっとやっかいな表現。言いにくいことを書くときに使うので、著者の心理を表していることが多くておもしろそう。

データ

特に使う予定もなく適当に収集していたツイートデータを利用。2014年1月~3月のツイートの中から (ry を含む9921ツイート(RT除く)を使った。
(ry を含むツイートは全ツイートの約0.016%だった。10000ツイートに1ツイート含まれてるくらい。数としてはそんなに多くないのかな、どうだろ。

意味

単なる略として使われているのか、言いにくいことを書く場合に使われるのか。
ざっと見た感じだと、単なる略として使われてるケースはあまり多くなくて、言いにくいことを略すケースが多かった。基本的には否定的な表現をぼかす(ぼかせてないけど)ために使われていた。

なになになになになに((ry
「タイガーのマグカップがーー」「バーナビーのマグカップがーー」「タイガーのマグ(ry」「バーナビーの(ry」
  • 言いにくいこと
正直、向こうは気使わなきゃいけないからめんどi(((ry
中二病にしか見えな(ry
文中のどこで使われるか

「以下略」という意味で使われるので、基本的に文末で使われることが多く、10055の(ryのうち、9265は文末相当の場所に出現していた(文末判定、雑なのでもう少し文末多いと思う)。
ほとんど文末だけど、それなりに文中にでてくるものがある。あと、文中に出てくるものは略というより固有表現などの伏字として使われていることも多くて面白い。

まぁ、冗談はさておき作ったら報告よr(ry
iPhoneのカメラが最高だって何度言えば(ry
全国民の票とらないとまず世界が認める(ryなんてわからないしね〜
やはり、最後に選手を出迎えてたハ(ryは社長だったか。
え、今日部活ないとかきいてn(ry駅まで来ちゃったしwwwwww
単位

(ry はどういう単位(文、文節、形態素など)で使われているか。
文単位はほとんどなくて、他は色々。というか、形態素解析できないから、統計とれない(「(ry」を辞書登録すればある程度できる?)
文節単位、形態素単位で略されていることが多いかと思ったけど、もっと細かく(ryが使われていて、「t(ry」とか、略すより長くなっているものもあるので、単なる略ではなく、言いにくさみたいなのが考慮されて使われているんだろう

彼女と京都で着物デートして、沖縄でダイビングしよう。(ry
  • 文節
過度なスパム報告は運営が(ry
仕事の効率が高いかというと (ry
最悪近くの公衆電話から持ってく(ry
忘れてたわけじゃ(ry
つまんない妄想ばっかしてないで荷造りしなきゃ……めんどく(ry
(ちょっと歌詞間違えt(ry
つまんn(ry
ngram

とりあえず、(ryの前の文字Ngramをとってみた。文末で使われていそうということがわかるくらい?

1 頻度 2 頻度 3 頻度 4 頻度
1 が(ry 487 って(ry 122 ...(ry 59 てくださ(ry 32
2 t(ry 356 から(ry 100 くださ(ry 44 ああああ(ry 29
3 は(ry 322 ..(ry 64 あああ(ry 30 と思うが(ry 26
4 て(ry 316 じゃ(ry 62 思うが(ry 26 てくだs(ry 22
5 な(ry 307 っt(ry 56 くだs(ry 25 んどくs(ry 14
6 に(ry 304 しt(ry 48 ったら(ry 24 となので(ry 12
7 …(ry 285 たら(ry 48 なので(ry 23 …つきあ(ry 11
8 n(ry 276 ださ(ry 45 じゃな(ry 22 まとめて(ry 11
9 s(ry 275 して(ry 44 ・・・(ry 21 んどくさ(ry 10
10 k(ry 275 でも(ry 44 るから(ry 20 うううう(ry 10
まとめ

(ry という表現、おもしろいなーと思ったので、簡単に分析してみた。
基本的に文末で使われて、単なる略というよりも言いにくいことをぼかすために使われるという感じだった。一部伏字として使われているのが興味深い。
言語処理タスクとして、言語モデルとかを使って(ryを補完できるのか、(ry部分が肯定か否定かを判定できるのかあたりが気になるかな。