Sansan Tech Blog

Sansanのものづくりを支えるメンバーの技術やデザイン、プロダクトマネジメントの情報を発信

NetSci-X2020に参加してきました

こんにちは!DSOCの西田です。

少しずつ春めいてきて、春夏物の服を買いに出かけましたが、気づいたら来年の秋冬物を予約しているということがありました。次回はしっかりと春夏物を見にいきたいと思います。

さて、本題に移ります!今回は1月20~23日に早稲田大学で開催された、ネットワーク科学の国際学会であるNetSci-X2020にDSOC R&D Group SocSci Teamのメンバーで参加してきましたので、そのダイジェストをお伝えしたいと思います!

過去にも参加しているNetSciのリージョナルカンファレンスに位置づけされるのがNetSci-Xです。東京では初の開催であり、約350名の方が参加する大きな学会でした。この学会では、弊社はスポンサーを務め、SocSci Teamから計4本の研究をポスター発表しました。
f:id:sansan_nissy:20200212154149j:plain

f:id:sansan_nissy:20200212154501j:plainf:id:sansan_nissy:20200212154519j:plainf:id:sansan_nissy:20200212154527j:plainf:id:sansan_nissy:20200212154541j:plain



ポスターは以下で公開しておりますので、どうぞご覧ください!
ポスターのデザインもクリエイティブチームの方がかっこよくしてくれました!

speakerdeck.com
speakerdeck.com
speakerdeck.com
speakerdeck.com


今回のブログはダイジェストということでチームメンバーそれぞれが印象的だった研究をご紹介します。

目次は以下の通り。

[臼井セレクト] "The dynamics of collective social behavior in a crowd controlled game: Twitch plays Pokémon"

  1. ポケットモンスターレッドをTwitchに公開し、チャットにアクション(上下左右ab)を書き込むとキャラを操作できるようにBotを作成(行動している間の操作は無視)し、全員が特定の目的を達成するための行動をとる群衆のダイナミクスを分析した。2週間以上で合計100万人のユーザが訪れ、ゲームをプレイした。
  2. 目的を達成することを邪魔するユーザー(トロール)が発生することによってクリアが困難になったため、6日目に投票制を導入し、5秒間で最も多くの投票された行動をとるように仕様変更をすると、暴動が起こった。
  3. DemocracyとAnarchyのコマンドを用意し、Democracyが全体の80%を超えたら投票制、20%を切ったら無法制(従来通り)にすると、多くのユーザがどちらか一つに投票し、投票を変えるユーザはほとんどいなかった。
  4. DemocratsよりもAnarchistの方がアクティビティは高く、Democratsは投票制に変えることに成功すると興味を失い投票をやめ、Anarchistは投票制に変わるたびに新規参加ユーザも含めて抗議行動をとった。

感想:
100万人の行動のデータを取得した大規模実験はすごいの一言です。集団心理をここまで大規模に実験した例は希有であると言えるでしょう。ユーザがDemocratsとAnarchistに別れ、それぞれ特有の行動傾向が存在するというのは、現実世界を一部説明しています。また、全員で一つの目標を共有しているにもかかわらず、トロールが発生する非合理性を実際に観測した点についても非常に興味深い。今後このデータを使った様々な研究が期待されます。

発表タイトル
"The dynamics of collective social behavior in a crowd controlled game: Twitch plays Pokémon"
Alberto Aleta & Yamir Moreno

  1. ソーシャルネットワークにおいて、人のanonimityを超えてネットワークで観測されない人と人の関係などを予測することがリンク予測アルゴリズムによってある程度可能になっている。
  2. この研究では、ユーザーが自分の公表するエゴネットワークの構造を変えることで、類似度指数に基づいたリンク識別アルゴリズムから公表しない自分の繋がりの一部(実の家族や親友関係、知られたくない繋がりなど)を隠すことができると証明されている。
  3. 様々な類似度指数に基づいたアルゴリズムから自分のつながりを隠すという問題はNP-completeであることが証明されているが実用可能で、十分に効果的なアルゴリズムがこの論文に挙げられる。
  4. シミュレーションの結果、ユーザーのリンクを隠す戦略として、新しいつながりを作ることより、既存のリンクの一部を削除することが効果的であると明らかにされている。更にランダムにリンクを削除するより戦略的に行った方が効果的であることも証明された。

感想:
経済学者は誰でも知っているLucas Critiqueを思い出した。データサイエンティストがリンク予測アルゴリズムを用いた時に、ネットワークのノードとなるユーザーのインセンティブに影響を与える可能性がある。ユーザーの意思決定を考慮したアルゴリズムを使わない限りはアルゴリズム自体がネットワークの構造を内生的に変える可能性がないと保証できない。

発表タイトル
"How to Hide One's Relationships from Link Prediction Algorithms"
Marcin Waniek, Kai Zhou, Yevgeniy Vorobeychik, Esteban Moro, Tomasz P. Michalak & Talal Rahwan

[西田セレクト] "Collective effects of individual decisions -- the case of the Nobel prize"

  1. ノーベル賞の受賞者決定プロセスのように、専門家グループが個人のパフォーマンスを評価するような集団意思決定では、NominatorsとNomineesの関係性などが意思決定の結果に作用し、予期しない結果となる可能性がある。
  2. 本研究では、NominatorsとNomineesの関係性を有向ネットワークとして捉え、政治、性別、国籍の同類性(Homophily)が受賞者決定にどのような影響を与えているかを分析した。
  3. 分析の結果、1)第二次世界大戦の前後で、ノーベル賞関係者(Nominators、Nominees、Laureates)はドイツ出身者中心からアメリカ出身者中心へと変化した、2)男女ともに、Nominatorsは同性である人をNomineesとして推薦する傾向にある、3)NomimatorsとNomineesが同じ国籍である傾向が強く、生理学・医学賞と文学賞でその傾向が強く、化学賞、平和賞、物理学賞で弱い傾向がある、以上3つのことが明らかになった。
  4. 上記の分析結果より、明らかにノーベル賞関係者の属性にはバイアスがあると言えるため、集団意思決定の際には多様性を担保するなどのバイアスを除くプロセスが望まれる。

感想:
受賞者の決定プロセスにおいては、公平性が担保されることは重要であると思うので、今回の研究結果はそのプロセスを改めるためにも貴重な研究であると思った。バイアスを除ける集団の意思決定プロセスを経済学を使いながら考えてみたい。(もしそういった研究があれば教えてほしい)

発表タイトル
"Collective effects of individual decisions -- the case of the Nobel prize"
Riccardo Gallotti and Manlio De Domenico

[前嶋セレクト]"Preference for Number of Friends in Online Social Networks"

  1. 特定の「数字」が人々の意思決定に及ぼす影響を研究(例:「8」は中国や日本で縁起の良い数字。「13」はキリスト教圏の多くの国で不吉な数字。)
  2. これらの(非合理的に見える)選好は、現代の社会でもなお影響力があるのではないか?と考え、著者らは、中国のマイクロブログサービス "Weibo" にフォロー数の分布において、「200」にピークがあることを確認した。
  3. フォロー数が"200"に近いのユーザーの特徴としては、1)アクティビティが少ない、2)被フォロー数が少ない、3)有名なユーザーをフォローする傾向にある、以上3点を確認した。
  4. 地域別に検討すると、中国の中でも経済的に発展していなかったり、教育水準の低い地域でより顕著に確認される。

感想:
単なる「アルゴリズムによる交絡(algorithmically confounding)」ではないか?と疑問に思った。つまり、ユーザーの選好とは独立して、プラットフォーム自体に、フォロー数を200に調整するような何らかの仕組みが実装されている可能性がある。"200"が中国で何か特別な社会的・文化的な意味を持っているという資料は確認できなかった(上海出身の同僚にも聞いたが、心当たりはないという)。Botによる影響ではないかと考えてAPIを調べたところ、最大2000までしかフォローできないという仕様があることが分かった(参考)。実際、ポスター中の分布にも、2000付近にピークがあった。しかし、他のAPIドキュメントの中にも、"200"にピークが来ることを説明するような仕様はなかったため、非公開のアルゴリズムが作用している、もしくは、本当にユーザーが「キリの良い数字」として”200”を選好している可能性がある。ちなみに、当社の名刺管理アプリサービスEightも、縁起の良さが命名の理由の一つになっています。

発表タイトル
"Preference for Number of Friends in Online Social Networks"
Fanhui Meng, Haoming Sun, Jiarong Xie, Chengjun Wang, Jiajing Wu and Yanqing Hu

[真鍋セレクト]"The Power of Communities: A Text Classification Model with Automated Labelling Process Using Network Community Detection"

  1. カスタマーサポートのチャットボットのテキストの分類に、ネットワーククラスタリングのアルゴリズムを使用。
  2. TF-IDF のコサイン類似度をエッジのウエイトとして、テキストをノードとしたネットワークを作成。
  3. そのネットワークに対し、ルーベイン法によるコミュニティ検出を適用。Class-split と Class-merge から最適なコミュニティ数を決定。
  4. ネットワークコミュニティとして分類されたテキストは、人手によるラベリングよりも精度が 2.68 - 3.75 % 高かった。

感想:
テキストの分類は自分も現在取り組んでいるタスクなので、興味深く発表を聞き、私たちが扱えるデータにも適用してみたい手法だなと思いました。ただし、K-means や Topic Model と比較した場合の精度や、分類の特徴の違いが不明。それらのテキスト分類法と比較した結果を知りたい。

発表タイトル
"The Power of Communities: A Text Classification Model with Automated Labelling Process Using Network Community Detection".
Minjun Kim & Hiroki Sayama.

NetSci-X 2020を終えて

パリで開催されたNetSci 2018から、NetSciに参加するのはこれで3回目でしたが、どんどんネットワーク科学が盛り上がってきているのを感じます。あらゆる分野でデータを「ネットワーク」と捉えることができるため、このコミュニティは多様性があり、毎回新しい気づきをくれます。

上記で触れた研究以外でもキーノート講演のバラバシ氏のプレゼンテーションはとても刺激になりました。講演のテーマはいかにして複雑ネットワークをコントロールするかというもの(メインで紹介された論文はこちら)。ネットワークにおけるつながりは内生的に形成されるものであるため、いかにネットワークに介入するかというのは個人的に気になっていたトピックです。今回のバラバシ氏の研究はそのトピックに関連するものだったのでとても興味深かったです。

講演後のバンケットではバラバシ氏と記念撮影や名刺交換をさせていただきました!
昨年のNetSciに応募したビジュアライゼーションについてツイートもしていただき、さらにファンになりました!笑

f:id:sansan_nissy:20200212154203j:plain

今回はSocSci Team全員で参加した国際学会でした。
みな刺激を受けたようなので、得られた研究のフィードバックをもとに研究開発の質を高めていきたいと思います!

最後になりますが、バラバシ氏にもツイートしていただいたデータビジュアライゼーションは現在第二弾を開発中です!
2月28日より始まるMedia Ambition Tokyoにて展示させていただくことになりましたので、ぜひお越しください〜!
次回はこのMedia Ambition Tokyoに関するレポートをお届けしたいと思います!では!

jp.corp-sansan.com




buildersbox.corp-sansan.com
buildersbox.corp-sansan.com

© Sansan, Inc.