Sansan Tech Blog

Sansanのものづくりを支えるメンバーの技術やデザイン、プロダクトマネジメントの情報を発信

「ML勉強会」を開催しました

こんにちは、DSOC 研究員の大垣です。

先日5/14(金)に開催した「ML勉強会」のレポートをお届けします。
sansan.connpass.com

概要

今回の勉強会は、「ML(機械学習)」という広めのテーマで行いました。
これは、直近の勉強会が「経済学」「データ分析コンペ」というテーマで開催されていましたので、逆にテーマを絞らないでみようという意図があります。
buildersbox.corp-sansan.com
buildersbox.corp-sansan.com
最終的に、計3つの発表の分野は「自然言語処理」「グラフ」「画像処理」と散らばった感じになりました。

発表者としては、DSOCから研究員の保坂と私(大垣)、そしてゲストとして株式会社Ristから藤本さんをお招きしました。
また、勉強会はzoomを利用し、懇親会はGather.Townというサービスを利用して、それぞれオンラインで行いました。

以降は、各発表について簡単に振り返っていきたいと思います。

発表1: Graph Neural Network を用いたレイアウトつき文書からの情報抽出

発表者: 保坂 大樹(Sansan株式会社 DSOC 研究開発部 Data Analysis Group 研究員)

「レイアウトの情報を考慮した上で、文章から情報を抽出する方法」に関して、話をしていただきました。
前半では、念頭にある課題やその課題に関する研究の動向を説明していただきました。レイアウト情報を考慮する方法として、大きく分けて「グラフベース」「グリッドベース」「言語モデルベース」「表現学習ベース」という4つの方向で、近年研究がなされているとのことでした。
後半では、グラフベースの手法の中でもGraph Neural Networkを用いた研究について、2つ紹介していただきました。文章とグラフという2種類のデータを扱うため、モデルはどうしても複雑になってしまうように思いますが、それぞれのアルゴリズムの全体像から説明していただきましたので、私のように今回のテーマに馴染みが深くない人でも、理解しやすい内容であったように思います。

なかなか難易度の高いテーマだとは思いますが、引き続き研究開発に邁進していただければと、期待しています。

発表2: 良いnode embeddingとは?

発表者: 大垣 翔(Sansan株式会社 DSOC 研究開発部 Data Analysis Group 研究員)

Node embeddingの評価手法について、私が重要と考えるものを、比較しつつ紹介しました。具体的には、Link Prediction、Node Classificationといったメジャーな評価手法にはじまり、より精緻な評価を目指して距離空間に基づく評価手法についての話をしました。
今回紹介した2つの距離空間に基づく評価手法は、それぞれMetric EmbeddingとCoarse Geometryという数学の分野が関係していまして、その中からnode embeddingに関連する重要な結果も取り上げました。

このような話をした背景として、社内で扱うnode embeddingの評価をより精緻に行いたいという目的があります。今回は俯瞰的な内容でしたが、「社内のnode embeddingの評価をどう行っているか(どう行うことにしたか)」という実践的なテーマで、将来どこかで話ができればと思っています。

発表3: NeRFの概要と最近の派生系についてのふんわり紹介

発表者: 藤本 裕介(株式会社Rist Deep Inspectionチーム AIエンジニア)

昨年発表されたNeRFについて、話をしていただきました。NeRFは、一つの物体について、(3次元空間における)視点を入力とし、その視点から撮影された画像を出力することができるモデルです。NeRFによってできることを知るには、以下の公式ページを見ていただくのが早いように思います。
www.matthewtancik.com

発表では、NeRFの概要を掴むことを目標に、論文のタイトル(Representing Scenes as Neural Radiance Fields for View Synthesis)を理解するところから始まり、モデルの構成や学習方法まで説明していただきました。
また締め括りとして、NeRF以降の研究についても紹介していただきました。NeRFは、使用する画像の撮像環境への要求が高かったり、学習と推論に時間がかかるなど、利活用を考えると課題がいくつかあるとのことでした。ですが、以降の研究によりNeRFが持っていた課題は徐々に解決されてきているようです。

この分野への私の知識は2,3年前で止まっていましたので、直近の進展に対する驚きは大きかったです。数年後には画像処理における常識的な技術になっているのでしょうか。今後の進展への期待が高まりました。

最後に

今回のイベントは500名を超える方に申込みいただき、当日は310名の方に参加いただきました。オンライン開催で参加しやすいとはいいつつも、多くの方に参加していただき、この分野への関心の高さを実感しています。
また、勉強会と懇親会ではそれぞれの発表に対して、いくつもの質問をいただきました。私の発表に対しても、数学寄りのマニアックな発表内容でしたが、質問を複数の方からいただき、その方の関心が伝わってきて嬉しかったです。
アンケートでは、今後の勉強会で聞きたいテーマなどフィードバックをいただきましたので、次回以降の勉強会に活かしていければと思います。

この度は、勉強会、懇親会に参加してくださったみなさま、ありがとうございました。一人でも多くの方に、参考になった部分があったのでしたら、主催者の私としては嬉しい限りです。
そして、発表者、運営者のみなさまも、ありがとうございました。みなさまのおかげで、勉強会を無事終えることができました。

インターンの募集

DSOCの研究開発部では現在、研究員の夏季インターンの募集をしています(応募の締切は6月18日(金) 18:00までです)。実施期間は、9月6日(月)~17日(金)の2週間の予定です。データ分析に携わられている方でしたら、幅広く応募いただける内容になっていると思います。Wantedlyに募集要項でしたり、過去の実施レポートを載せていますので、少しでも興味がおありの方はぜひご覧ください。
www.wantedly.com

© Sansan, Inc.