Sansan Tech Blog

Sansanのものづくりを支えるメンバーの技術やデザイン、プロダクトマネジメントの情報を発信

アメリカ・バーモント州で開催されたNetSci2019に参加しました!

f:id:sansan_nissy:20190619114128j:plain
こんにちは!DSOCの西田です。もうすぐ夏物のセールが始まる頃ですね。にもかかわらず、このブログが公開される頃にはAWの商品の予約がおそらく完了していることでしょう。

さて、本題に移ります!5月27~31日にアメリカ・バーモント州で開催されたネットワーク科学分野で最大級の国際学会であるNetSci 2019にてオーラル発表をしてきました。さらに発表だけでなく、Visualization Prizeというネットワークを可視化したアートワークを評価するPrizeに応募していました。応募した作品は弊社のイベントSIP2019で披露した、企業間のつながりを可視化した"Dawn of Innovation"です。そのポスターが掲載されたのと結果発表が行われたので、その様子も合わせて下記の内容でレポートさせていただきます!


ちなみに昨年もポスター発表で参加しており、その様子はこちらからご覧ください!
jp.corp-sansan.com


NetSci2019 〜みんな知っているはずの「バーモント州」〜

まずは、今回のNetSciについて少しご紹介します。今回は、バーモント州にあるバーモント大学で開催されました。「5月末にバーモントで行われる学会に行ってきます」的なことを言うと、「知らない!どこ?」と言われることが多々あり、なんか悲しくなりました。バーモントカレーは知っていても、バーモント州は知らない人が多いんですね!笑(バーモントカレーとバーモント州の関係については、ご自身でお調べください。笑)

ということでバーモント州について少しお話しすると、バーモント州はアメリカ北東部に位置し、カナダ・ケベック州に隣接する地域です。バーモント州の人口最大都市は約4万人のバーリントンで、アメリカ50州内の人口最大都市のうちもっとも小さい都市とのことです。(Wikipedia調べ)昨年の開催地であるパリとは異なり、自然あふれる土地でした。

学会の参加者数は約600人と昨年より200人ほど少ない参加者数でしたが、開催地人口1人あたり(多分)で見ると歴代最多の参加者となる、歴史に残る学会となりました!笑

こういうウィットに富んだ報告をする運営サイドはイケてますね!笑

f:id:sansan_nissy:20190619114254j:plain

また、オーラル発表の採択率はオフィシャルに公表されてませんが、聞いたところによると10数%程度というなかなか厳しい基準だったようです。

[オーラル発表]Dynamic Network Signatures of Labor Flows: Evidence from a Large Business Social Network

f:id:sansan_nissy:20190619114523j:plain
まずは、今回オーラル発表した内容についてご紹介します。

昨年のNetSci2018で報告したときからテーマは大きく変わっておらず、転職するEightユーザーがどのようなビジネスネットワークの特性を持っているかを分析した結果を報告しました。

昨年の発表にて多くの方からいただいたアドバイスを踏まえて、昨年はStaticなネットワークの特性と転職の関係を見ていたのに対して、今年はDynamicなネットワークの特性を見るべく、データセットと変数を作成して分析しました。

主な発表内容は下記の通り。

  1. 転職のメカニズムを明らかにすることで、イノベーションに重要な企業間のネットワークにおける知識の伝播のメカニズムを解明することにつながる
  2. ネットワークの変化(具体的には、保有する「弱いつながり」と「強いつながり」の変化)が転職にどのように影響を与えるのかを分析した
  3. 「弱いつながり」はコミュニティをまたぐつながりがいくつあるか、「強いつながり」はクラスタリング係数の半年間での変化量と定義した (個人単位の名刺交換のネットワークはUnweighted networkのため)
  4. 分析した結果、「強いつながり」は転職に正の影響、「弱いつながり」は負の影響があることがわかった
  5. 「弱いつながり」は転職に有益な情報をもたらす可能性があるが、その頻度は少なく、「強いつながり」の方が一度に伝搬する有益な情報の量は少なくてもその頻度が多いため、結果、転職に必要な情報を伝搬する可能性が高いというメカニズムが考えられる

詳細は下記のスライドをご覧ください。

speakerdeck.com


発表を終えて、まだまだいくつか分析手法を試して分析結果を検証したいと思いました。

アドバイスくださった方ありがとうございました!

個人的にはこれが人生初の学会でのオーラル発表で不安でしかなかったですが、面白かったというツイートもあり、ホッとしました。

twitter.com

もっといい研究にできるように精進したいと思います!

[興味深かった研究の紹介]

今回の学会では興味深い研究が多く、あとでしっかり論文を読んで理解しようとチェックしたものの数は20本を軽く超えてました!ボリューム的にこのブログで全て紹介するわけにはいかないので(忙しくて全部読めていないので)、特に印象に残った2つの研究をご紹介したいと思います!

Estimating Network Effects Using Naturally Occurring Peer Notification Queue Counterfactuals

1つ目は、ソーシャル・ネットワークにおいて、いかに効率的に因果効果を推定するかというものです。因果効果を推定するならば、通常はRCTやA/Bテストを実施すればいいと考えます。しかし、SNSなどのソーシャル・ネットワークにおいては、処置群と対照群に分けるときのコストやネットワークを通じて相互に影響を与えうることを考えるとなかなか推定するのが難しくなってきます。そんな時にどうするべきかという解決策をLinkedInのデータを用いて導いたのがこちらの研究です。主な内容は下記の通りです。

  1. 因果効果を推定するには、SUTVA(Stable Unit Treatment Value Assumption: あるユーザーの行動は受けた処置によってのみ影響を受けるとし、他のユーザーが受けた処置に影響を受けないという仮定。つまり、他のユーザーが処置を受けたか否かに関わらず処置の効果は一定でなければならない。)
  2. 例えば、ユーザーAのSNSフィードに並ぶコンテンツの順序を変更する処置を与えた時、ユーザーAの行動が変化し、その行動によってユーザーAとつながっている対照群であるユーザーBの行動にも影響を与える可能性があるため、この仮定を満たさないことがある
  3. このようなケースを避けるために実験やA/Bテストを行うことも可能であるが、エンジニアリングの観点からコストがかかるので現実的ではない
  4. このような状況の中で、観察データからメッセージのやりとりがアプリのエンゲージメントに与える影響を効率的に分析するために、アプリ内で外生的に行われる勤続記念日や誕生日通知を操作変数として利用し、メッセージのやりとりの因果効果を識別した
  5. OLSやFixed Effectと操作変数法の推定結果を比較すると、前者は後者に比べて約3倍近い上方バイアスがかかっていることがわかった

この研究は、実際のビジネスに影響を与えずにユーザーへの施策などの効果を効率的に推定する方法を提案しており、とても勉強になりました。A/Bテストはコストがかかると敬遠されがちな場合でも、観察データから因果効果を識別できるので非常に実務に役立つ研究だと思いました。こういった研究も多くなってきたので、企業に勤めているデータサイエンティストの方も国際学会などのアカデミックな場に積極的に参加すると有益な情報が得られるかもしれません。

詳しくはこちらの論文をご覧ください!
arxiv.org

Network Structure of online dating

2つ目は、最近流行りのオンラインデートに関するネットワークに関する分析です。日本では、マッチングアプリと言われるものです。アメリカでは、国民の3人に1人がオンラインデートを用いて、出会い結婚していると言われ、日本でも20代〜30代の出会いたい男女の「5人に1人」がマッチングアプリを利用しているとのことです。*1

今回の発表された研究では、アメリカにおけるオンラインデートでマッチングが成立した後のメッセージのやりとりのネットワークを分析した結果、下記のことが明らかになってきたという発表でした。

  1. オンラインデートにおけるユーザーのデモグラフィックや価値観は地理的に異なる
  2. ユーザーのDesirability(望ましさ・魅力度)をページランクで定義した(メッセージをたくさん受け取るような人ほど魅力的になる指標)
  3. 男女ともに、自身よりちょっとDesirabilityの高いユーザーとコンタクトする傾向にある
  4. 初めのメッセージから返信を受ける確率は女性の方が男性より少し高いが、どちらも自分より魅力度の高い人からの返信率は低い
  5. メッセージの内容(文章の長さやポジティブな単語の使用割合)は返信率に少し影響を与えている結果は見られるが、大きな差はない

残酷な現実も少し垣間見える内容でした...。

今のところ、オンラインデートの必勝法はなさそうという結論ですね!笑

個人的に面白かったのは、地理的に価値観が異なるというもので、例えば「パリでキスするのと森の中でキスをするのはどちらがいいか?」という質問には以下の写真の通り、地理的な差があったことでした!笑

出身地や居住地によって価値観が形成される・価値観にあった土地に住んでいるなどの可能性が示唆されますね。ちなみに私はパリ派です!笑

f:id:sansan_nissy:20190619114620j:plain

より詳しく結果を知りたいという方は、下記の論文をご覧ください!

advances.sciencemag.org

www.sociologicalscience.com


もっとライトに知りたいという方は、こちらの書籍がいいかもしれません。
www.amazon.co.jp

[Visualization Prize] Dawn of Innovation

今回のNetSciでは上記で紹介したような研究だけでなく、ネットワークを可視化したアートワークを評価するVisualization Prizeにも応募していました。今回は以前ブログでも紹介し、SIP2019にて展示した”Dawn of Innovation”が最終審査に残り、最終日にその結果が発表されるスケジュールだったので、学会に参加した時からずっと落ち着きませんでした(笑)

私が投稿した作品の詳細はこちらの動画と記事をご覧ください!

vimeo.com

wired.jp


会場にはポスターにて各アートワークが展示されていました。

花をモチーフにネットワークを描いている作品や生物学や進化論をテーマにした作品であったり、参加者全員に配られるバッジもアートワークの一つとなっていたりするなど、2次元ではない作品もある自由なアートワークが展示されていました。

f:id:sansan_nissy:20190619114640j:plainf:id:sansan_nissy:20190619114643j:plain
f:id:sansan_nissy:20190619114834j:plain

他のどの作品もクオリティの高いビジュアライゼーションだったので、Prizeを受賞できるのかわからないなと不安になりながら迎えた最終日の結果発表。

結果はなんと・・・

Visualization Prizeを受賞することができました!
jp.corp-sansan.com


SIP2019での展示に向けて構想を練るところから考えると、約1年かけてビジュアライゼーションを開発することに向き合ってきました。振り返ると、この1年間は私たちが扱う名刺交換という「出会いのデータベース」にどんな価値があるのかを毎日のように考え続けていたと思います。
GAFAをはじめ、世界中に大きなインパクトを与えられるビッグデータは数多く存在します。昨年から国際学会に参加し、世界中のトップレベルの研究者・企業が扱うデータも見てきました。その中でも「私たちにしかできないことはなんだろう」と常に問い続けてきました。誰よりも考えた自信があります。その現時点の答えを表現したのが今回のアートワークです。
Prizeを受賞したのは嬉しかったですが、満足はしておらず、なんだか複雑な感情なのが正直なところです。なぜなら、このデータに向き合い、その価値を問い続け、答えを導くことは今後もしなければいけないからです。その答えはその時々で変わるものだと思うので、これからも私たちが目指す世界観を、これまでに見たことないようなビジュアライゼーションで伝え、社内外の方々の心を動かせたらなと思います。

また、当然1人でこのアートワークを作れるわけではなく、ビジュアルとサウンドでそのコンセプトを表現し、「世界初、世界一」を目指す気概で、展示している最中でも一緒にクオリティを高めてくれたチームメンバーの皆さんには感謝してもしきれません。

次回のNetSciは?

以上が今回のNetSci2019に関するレポートでしたが、なんと次回のNetSci(正確には、NetSci-Xというリージョナルカンファレンス)は来年1月に東京で開催されます!!

f:id:sansan_nissy:20190619115510p:plain
netscix2020tokyo.github.io

今回は、ネットワーク科学でもっとも有名といっても過言ではないAlbert-László Barabási氏もスピーカーの1人になっています!トップレベルの研究者と交流できるチャンスなので、これまでネットワーク科学に挑戦したことない人でも奮ってご参加ください!

また、弊社はこの学会のスポンサーとして本学会運営を支援します。ネットワーク科学自体、他の学問分野に比べれば誕生したばかりの分野です。次回のNetSci-X 2020を皮切りに「ネットワーク科学といえば、日本」と言われるくらいにこの学問分野を盛り上げていきたいと思っています!共に本学会を盛り上げてくださるスポンサーも募集中ですので、ぜひこちらもご検討ください!

7月には、IC2S2(2019: 5th Annual International Conference on Computational Social Science)に参加予定ですので、次回のレポートもお楽しみに!

© Sansan, Inc.