Next Article
measure-106354_1280

【CuRAZYと海外比較】リスト記事が29だと読まれる理由とは?

◆ラフテックラボについて◆

ラフテックラボは、株式会社LAUGH TECHの運営するCurazyにおいてメディア運営の知見や、笑うを科学した研究レポートになります。 海外文献の翻訳や、実際のCurazy統計情報等を公開していく予定です。

【日米の違い】リスト記事が29だと読まれる理由とは?

※以下記事は、Gilad Lotanの29 reasons you’re reading this articleを翻訳し、一部Curazyの視点を加えた記事になります。

 

はじめに:奇数の長さのバズフィードリスティクル記事が偶数よりいい理由

あなたは、ブログを公開して、たくさんの人を引き込みたい・読んでもらいたい・シェアして反応して欲しいと、考えています。

そうした時、あなたは何をしますか?

普通であれば、SNS上でクリックしシェアされるための、完璧にパッケージングされたキャッチーなリストを作るでしょう。

つまり、『リスティクル記事※』を作るのです。
※カテゴリーやジャンル特化型の記事をリスティクル記事といいます。例:【天空に現れた天然アート】ユニークな雲の作品15選

長さはどれくらいにすべきでしょうか?
5つは少し少なすぎる気がします。
30はちょっと多すぎるし、しかも偶数です。

では、29はどうでしょうか?

30よりちょっと少なくて、しかも奇数。
いい数字だと思いませんか?

しかし、この29という数字、なんとなく好きな数字だから言っている訳ではありません。

奇数と偶数、パフォーマンスに有意な差があるというデータに基づいていると言ったらどう思うでしょうか?

そんな、ばかな!?と思う人は、続きをお読みください。

 

measure-106354_1280

 

リストについて

リストというものは、非常に長い間親しまれていまれている形式です。

聖書から音楽チャートまで、物事をリストの形にパッケージ化することは、とても簡単です。

ただし、リストの数は憶測に依って決められるが多いです。

オンライン上では、ある数字が他の数字より良い、ということについての多数の神話と宗教の様な信仰を見つけます。

特に奇数と偶数どちらがよいのかについての議論は尽きません。

ニューヨークタイムスやGILTを見てみると、メインページは3つの記事やアイテムで構成されています。

多くの人たちの間で、今は奇数の長さのリスティクルが、(特にバズフィードで)最も良いと言われています。編集者がそれらを選ぶ理由はあるのでしょうか?

私たちが知らない何かを知っているのでしょうか?

そしてデータを使ってこのことを理解することはできるのでしょうか?

それを今から、明らかにしようと思います。

 

明らかになる奇数の力

3ヶ月間10,000件のバズフィードのリスティクルを見たところ、偶数のリスティクルと奇数のリスティクルの間には統計的に有意な差が認められました。※グラフは元記事参考
ベータワークスデータチームは、メディア産業のデータの流れ、消費とソーシャル上でのユーザーの動きについても詳しいです。

私たちはメインストリームのメディアとブログについて、何が実際に読まれていてシェアされているかという見識を改めることにしました。

この微妙な違いに注目することで、普段よりパフォーマンスの高いパブリッシャーやドメインやブログを調査しました。

調査の仕方

オーディエンススコアと我々が呼んでいる指標を使うことで、ユーザーがコンテンツに対して行う行動の質を測定しました。

複数のパラメータから評価するモデルで、リンクに対して行動を行ったユニークユーザーの影響を強く受け数値化する事ができます。

また、オーディエンススコアは、多くシェアされている事が可視化されたりする前に、ある程度の段階でパフォーマンスの高いコンテンツを特定することができます。

Diggのエディターはこれを早い段階でコンテンツを特定するたくさんのシグナルのひとつとして利用しています。このスコアはDiggの読者にとって人気のコンテンツを評価するのにも役に立ちます。

バズフィードのリスティクルの長さについて、ブライアン・アベルソンとノア・ヴェルトマンもリストグラム分析を行っています。

公開されたリスティクルの長さの分布を示すだけではなく、記事のパフォーマンスを評価するために、オーディエンススコアを指標として私も図を作成しました。(最初のデータセットは、三ヶ月以上にわたる全ての公開されたバズフィードコンテンツを含んでいました。)

標準的なクラスタ分析の技術を用いて、他のバズフィードコンテンツからリスティクルを分離しました。

この手順については、この記事の最も重要な部分ではないので割愛します。

このプロセスの最後には、私のデータセットは概ね、10000個のリスティクルを含んでいました。

記事の大多数は、リスティクルとしてチェックされました。
(一部、”世界中から酸素が5秒間だけなくなったら何が起きるか?”などは、数字で特定してる為、混じってしまいました。)

 

調査結果

大きなリスティクルのデータ群を見ると、長さの分布は、アベルソンとヴェルトマンの結果に非常に良く適合しています。
長さが10のリスティクルは、他のものに比べてかなり多く公開されています。

これはバズフィードが10個の長さのリスティクルを他のパートナーブランドに売っているからです。

次に多かったのは15で、その次は12でした。リスティクルの数は20-29では急激に下降し、さらに驚くべきことに、11-21は10以下のものよりも、遥かに多かったです。

バズフィードのコミュニティメンバーは「150のハリーポッター面白gif」という記事をポストしているが、これは楽しい外れ値でした。

そうして解析を行ったデータセットでは、29が他のものに比べて最も多いという結果が出たのです。

 

■統計的な違いはあるのか

<本パート統計学的な内容を多分に含みます。掻い摘みますと、29は奇数リスティクルは統計において有用な結果を出しています。

ここからが面白いところだが、私たちはどうやって統計的にデータに有意に差があると言えるのだろうか?

これはただのトレンドを眺めるのと何が違うのだろうか?

ふたつのデータがお互いに有意な差があることを判定するための統計的なツールは幾つもあります。

仮説検定は統計的な検定の基礎であり、
観測された相関がランダムに起きているのか「本当の」現象なのかを特定する必要がありました。

科学やデータ分析は、最近ではあらゆる場所で用いられています。大まかに説明すると、まずふたつの観測されるデータセットに差がない、という帰無仮説を設定します。次に実際に差がないと言える不確かさの水準を設定します。

それから統計量を選択し、分析をします。
計算の結果が与えられたとき、我々は帰無仮説の妥当性をp値というものを使って判定します。
もしp値が必要な有意水準(多くのケースでは0.05、5%)より低ければ、帰無仮説は棄却されます。これは事象がランダム性によって発生した確率が5%以下であることを示しており、それゆえふたつのデータセットには有意な差があるということを意味しています。

もしp値が0.2のように高い場合、これはランダム性によって発生した確率が20%であるため、帰無仮説を棄却することに失敗するーーつまりふたつのデータセットの間に統計的に有意な差があるとは言えないことになります。

これらの統計を計算して、私は奇数の長さのリスティクルと、偶数の長さのリスティクルに統計的に有意なパフォーマンスの差があるかどうかを調査しました。

私はt統計値を計算し、回帰分析のp値を奇数リスティクルと偶数リスティクルのオーディエンススコアの平均を比較した。いずれもp値は0.05を下回り、帰無仮説を棄却できました、そしてデータセットに見られた差がランダム性によるものではないことを示すことができました。

私はフィッシャーの正確性検定やマンホイットニーのu検定など他の検定も用いたが、全てが奇数長のリスティクルに対して同じ結果を示した。私が素数長のリスティクルを偶数長のリスティクルに対して検定したとき、p値はボーダー上だったーー4.7%ーー有意な差はなかった。そしてついに、29が他の奇数よりも高いパフォーマンスがあるということがわかりました。この分析についての結論はiPythonノートにまとめて公開しました。

■戦略性

私たちは人間の脳は、イメージやビジュアルを好むことが知られています。

A/Bテストページをキャッチーなタイトルと共に用いて、コンテンツとエクスペリエンスをクリックに対して最適化してきました。

 

hummingbird-371308_1280

 例:驚愕】ハチドリは、なんと1時間に28万回も羽ばたく

 

そして今、奇数のリスティクルが、よりソーシャルネットワークでシェアされ、ゆえに多くの注目を集めることがわかりました。

もちろん我々の発見を公開し、このブログポストを可視化することで、この効果は減少すると思います。

 

■Buzzfeedの戦略に関して

もしバズフィードの編集者が、もっと多くのクリックを導く幾つかの確実な戦略について知っているとして、彼らは自分たちのユーザーに知らせたいと思うべきでしょうか?

ビジネス的には、もちろん伝えないと思います。

これは他の競合するパブリッシャーに塩を送るようなものです。
特にユーザーの注意を惹き合うグロースバトルを繰り広げている場合には!

さて、難しい質問は、どこにどうやって線を引くかということです。
私はデータサイエンティストとして、パフォーマンスを最適化するという技術を発見することが仕事です。

純粋にそれを発見するためだけではなく、ビジネスのために。こうした行動分析のような一般的な戦略は、データそのものの記述子(リスティクルデータ)あるいはユーザーメタデータ(典型的なユーザーセグメント)をベースにしています。

 

■最後に

ユーザーがもっとコンテンツとインタラクションするようなリコメンデーションシステムを作り上げて自分のサイトでもっと長い時間を過ごしてもらうようにしたとしします。

それは、倫理的な境界を越えてしまっていると言えるのではないでしょうか?

もしリコメンデーションシステムをユーザーの購入行動に結びつけたらどうなるだろう?

それも、倫理的な境界を超えるのではないか?

あるいは感情の状態については?

おそらく、いつかは潜在的な倫理の線引きを超えてしまう可能性があります。

 

それはまた別の機会にお話ししましょう。

Gilad Lotan

curazyvison

 

奇数よりも断然偶数のが優位になっている?(Curazyの場合)

日本の場合に関しては、意外な結果が待っていました。
現在のCurazyで掲載をしているリスティクル記事を偶数と奇数に分けて、

・クリック率

・シェア率

・いいね数

・コメント数  を分析しました。

結果、偶数は奇数に比べて以下の様な結果となりました。(偶数/奇数)

・クリック率  1.06倍

・シェア率   1.01倍

・いいね数   1.10倍

・コメント数  1.08倍

結果から言うと、偶数の方が日本では好まれる傾向がある様です。

また、バズフィードほどの奇数・偶数差が出なかった点も日米の違いです。(米国の場合は、±1違うだけでパフォーマンスが3倍にも上がる事があります。)

 

日本におけるマジックナンバーはいくつか?

バズフィードが詳細に関して非公開な様に、Curazyも非公開です。

(ご了承ください。)

ですが、これから記事を作る人たちにヒントだけ与えると、コンテンツにより数字は変異させています。

・Gifなどはたくさんの記事をリスティクル化するとモバイルユーザーに対し重い印象を与える

・twitter系のトレンドも個数を絞る

・動物系の画像は、画質が低いものであれば数を増やす

・文字コンテンツであれば、文章テンポやトーンと併せて数字を決める

などの条件に基づきます。
大量に集めたうえで、規定の数字に併せて削り込むというのがリスティクル記事のパターンです。数に合わせて集めるよりも時間と手間が発生します。その反面、シェアやいいねがされやすいコンテンツを作る事が出来るのです。

ホームランは打てないけれども、安打を量産する猫記事

今回の統計実施に伴い、「猫記事」OR「猫以外記事」でも検証を行いました。

結果、「猫記事」は「猫以外記事」に比べて低いパフォーマンスを出す結果となりました。(猫記事/猫以外記事)

・クリック率  0.68倍

・シェア率   0.82倍

・いいね数   0.67倍

・コメント数  0.85倍

 

猫記事に関しては、サムネイルを見るだけで(ほっこりし)満足されてしまう。クリックしてくれた人は、一般コンテンツに比べシェア自体には壁があまりないということが分かっています。

PVを至上化させるためには、猫記事以外に分量を割くべきとの考えもあります。ペット系を取り扱うメディアは、飽和状態になりつつあり、厳しい状況になっているという話もあります。

そうした中でも、下記観点でCurazyは猫記事を引き続き取り扱う予定です。

①Curazyカルチャーは猫である(文化的設定)

②離脱率の関係(ライトコンテンツでつかみ、ヘビーコンテンツへの誘導)

③再回帰的観点(猫部などの再回帰的なコンテンツとして猫は永続的に残りやすい)