こんにちは、DSOC R&Dグループ研究員の奥田と吉村です。名古屋駅の新幹線ホームのきしめん屋で、15分後に乗らなければいけない新幹線を控え二人できしめんを急いで食べました。
さて、2019年11月20日から24日にかけて名古屋で開催された第22回情報論的学習理論ワークショップにて、SansanのDSOCから2件のポスター発表を行いました。ここでは、私たちの発表内容やIBISの様子をご紹介したいと思います。
IBISについて
情報論的学習理論ワークショップ(通称:IBIS)は、機械学習に関連した国内最大規模のワークショップです。国内の同系統のイベントの中では、かなり理論/学術寄りの発表が多い印象です。今年は企画セッションが4件のほかに、全238件のポスター発表がありました。また、今回は招待講演としてDeepmindのMarc Deisenroth氏、筑波大学准教授でありメディアアーティストである落合陽一氏、滋賀大学教授でデータサイエンス学部を推進している竹村彰通氏の講演がありました。
Sansanは去年に引き続き2年連続の参加となりました。昨年の参加報告はこちらを御覧ください。
発表
ここからは、私たちのポスター発表の内容をご紹介します。
2-009: Link Prediction on a Large Business Social Network in Japan ーGraphSAGE based supervised inductive learning framework
この発表は李が主著者で、その他に弊社 R&D 研究員の Juan、西田、吉村が関わっています。李がイギリスのブリストル大学大学院を修了後、インターンとしてSansanに来てくれていた頃の研究内容をまとめたものです。その後、李は正社員としてジョインしてくれました。
内容は、実際の企業間の名刺交換ネットワークに対して、GraphSAGE というグラフ埋め込み手法と、DistMult と呼ばれる手法を組み合わせて End-to-End *1な Link Prediction に対する予測手法を提案、実験したものになります。
その結果、既存のグラフ埋め込み手法 (LINE, DeepWalk, GraphSAGE) により得られた分散表現を別の教師あり学習の入力とする2段階の予測方法と比較して、一気通貫で学習した GraphSAGE + DistMult の提案手法の方が性能が良いことが確認できました。
1-098: 大規模ネットワークにおけるノードの属性情報を利用した未知ノードのグラフ埋め込みの近似
奥田からは、グラフ埋め込みの近似手法の検討について発表いたしました。
一般的なグラフ埋め込み (Graph Embedding) を計算する際には、すべてのノードとエッジの情報が必要となります。一つの大規模なつながり構造を持ち、かつ常にノードが追加される性質を持つネットワークにおいては、すべてのノードに対するグラフ埋め込みを計算し続けることは、計算コストの観点から現実的ではありません。
そこで、すべてのノード/エッジの情報を使わずとも、追加されたノードの近傍情報のみを利用して近似的にグラフ埋め込みを得るような埋め込みベクトルを用意します。そしてその埋め込みベクトルと本来計算したい埋め込みベクトルの変換行列を学習することで、新規に追加されたノードのグラフ埋め込みを再計算無しに実現する方法を検討しました。
まとめ
IBIS2019では、弊社のサービスを軸としたネットワークに関する発表を行いました。
Sansan株式会社では、人と人との名刺交換の繋がりを元にした社会ネットワークに対して、様々な観点から新たな知見や価値創出に向けて研究開発をしております。もし私たちの取り組みに興味を持たれた方は、ぜひ気軽にお声がけいただければと思います。ビジネスの出会いからイノベーションを生み出す*2サービスを作るべく、一緒に働きませんか!?
【東京/メンバークラス】機械学習・データサイエンスの研究開発員 | Sansan株式会社 【東京】社会科学分野データサイエンティスト(DSOC) | Sansan株式会社