【タイトル修正】Twitterで映画の興行成績を予測:97.3%の正確さという驚きのデータ

 
Twitter 97.3% Accurate in Predicting
Opening Weekend Movie Box Office Returns 
 
 
筆者注:
このエントリは、Twitter 97.3% Accurate in Predicting Opening Weekend Movie Box Office Returns http://bit.ly/cU6vYo の翻訳紹介ですが、「0.973 は回帰分析の決定係数(相関係数の二乗)なので誤解を招く表現。アバターのような映画が数字を引き上げてるだけにも見える」というご意見 もありましたのでご参考までにお伝えいたします。適切な表現方法をご指摘いただけると幸いです。
*****
引き続き、@surveyml さんより、以下のようなご教示をいただき修正いたしました。
「本文は問題ないので的中度という言葉をはずぜば大丈夫かと。統計学的には「ツイート数や上映劇場数を使った予測モデルによって実際の興行成績の97.3%を説明できる」といいますが見出しには難しいですかね(笑」
「補足しますと、「的中度97.3%」だと、1000本の映画のうち 973本の成績を当てたといったイメージを持たれそうと思ったもので。また Fig.6 の2つのラインを予測と実測と勘違いした人もいたようです。」  
*****
 
ソーシャルメディアマーケティングの基本的活動は、例えばTwitterでの会話を「傾聴」し、ユーザーからの声に対応していこう、というようなことになりますが、Twitterでの会話は業績予測に使えるかもしれない、という驚きの調査データが紹介されていました
 
調査は、HP LabsのSitaram Asur氏とBernardo Huberman氏によるもので、Twitterで週末の公開映画の興行成績を97.3%の精度で予測できる、とのことです。
 
調査対象は、
 
24作品に対し、120万ユーザーの映画に関する290万ツイートを3ヶ月以上かけて
2.9 million tweets from 1.2 million users over three months for 24 movies
 
とのこと。
 
公開日近辺でのツイートと、公開される映画館という2つの変動要因を解析したところ、驚いたことに週末の公開成績を97.3%の正確さで予測した。一方、これまで最も基準とされてきたHollywood Stock Exchangeの、週末公開予測は96.5%の正確さである。
第二週の成績予測をするために、ポジティブなツイートとネガティブなツイートの割合を加えて算出したところ、94%の正確さで予測できた。
 
They then built a computer model, which looked at two variables: the rate of tweets around the release date, and the number of theaters its released in. Lo and behold, their model was 97.3% accurate in predicting opening weekend box office. By contrast, the Hollywood Stock Exchange, which has been the gold standard for opening box-office predictions, had a 96.5% accuracy.
To predict second-weekend performance, the authors created a ratio of positive tweets to negative ones. Then they blended that with the Tweet rate metric in another prediction algorithm. This time, the method was 94% accurate. (SocialMediaatWork.com)
 
上に引用しているグラフが、その一致を示しているものです(たぶん)。
 
このデータは映画の興行成績に特化したものですが、商品の評判に関するツイートを収集・分析することで売れ行きを予測する、ということもできるようになるかも(?)ですね。  
 
ご参考