Sansan Tech Blog

Sansanのものづくりを支えるメンバーの技術やデザイン、プロダクトマネジメントの情報を発信

Web DB Forum 2018 で登壇してきました!

こんにちは! DSOC R&D Groupの吉村 皐亮です。
入社して約半年が経ち、最近では徐々に会社にも馴染んで来て、自分の色が出せるようになってきたかなと思う今日この頃です。

さて、今回は今年の9月12日から9月14日にかけて、東京工業大学大岡山キャンパスで開催されたWeb DB Forum 2018に参加してきましたので、その模様を報告します。ちなみに、Web DB ForumにSansan株式会社の Data Strategy & Operation Center (DSOC)が参加するのは、昨年に引き続き2回目となります。

f:id:ssatsuki040508:20180919174304j:plain
こちらはWeb DB Forum 2018が開催された東京工業大学大岡山キャンパスです。初めて訪れましたが、非常に緑が多いキャンパスでした。あと、キャンパスの周りには非常に美味しい料理を出すお店がたくさんあり、ランチに重宝しました。

Web DB Forumって何?

まずはWeb DB Forumとは何かということから説明したいと思います。Web DB Forum (Webとデータベースに関するフォーラム) は、その名前の通りWebとデータベースに関する最先端の研究について関心のあるアカデミアや企業の研究者、技術者、そして、学生が一堂に会し、活発な発表や議論を行うフォーラムです。メインはWebとDBについてですが、実際にはデータベース基盤からセキュリティや自然言語処理に至るまで幅広い内容の研究発表が行われていました。

テクノロジーショーケースでの登壇

今回私は「ビジネスの出会いを変えるAI技術応用事例の紹介」と題して、Sansanの技術活用事例の紹介のために登壇しました。この発表では、弊社で取り組んだAI活用事例のうち「自然言語処理」、「社会科学」、「レコメンドシステム」、「画像処理」の4つの分野における具体的な事例をメインで話し、合わせてNIIの情報学研究データリポジトリにて弊社が提供している公開デモ名刺データについても紹介しました。

自然言語処理分野の事例

自然言語処理の分野の応用事例として取り上げたのは「Bidirectional LSTMを用いた姓名分割」です。こちらは、名刺のデータ化を行う上での一つの課題である姓名分割位置の特定のための基礎技術開発の事例です。以前弊社で開催した「自然言語処理領域に関わっていると避けては通れないあの話」というイベントのレポート記事の後半部分に詳細があります。

社会科学分野の事例

社会科学分野の応用事例として取り上げたのは「重回帰分析による名刺交換と営業成績との関係の分析」です。こちらは、世間的になんとなく思われている「名刺交換と営業成績とは何か関係があるのではないか」という問いに対して、弊社が行った名刺交換の情報と弊社の営業パーソンの営業成績との情報を用いて、重回帰分析により統計的にどの要素が有意に影響するのかを分析した基礎研究です。この基礎研究の詳細については、Data Science Reportとしてこちらで公開しています。

レコメンドシステム分野の事例

レコメンドシステム分野の応用事例として、弊社プロダクト「Sansan」の機能として試験導入している「スマートレコメンデーション」について紹介しました。この「スマートレコメンデーション」は、在籍する会社が保持している名刺の中から、その人がまだ会ったことがない人物を名刺交換情報のプロファイリングを基に、その人にとって有益そうな人物を選び出し推薦する機能です。
プロファイリングでは具体的には、大手向けの営業をメインでやっているとか、メーカー系を中心に営業を行なっているなどの情報を活用しています。また、実際にこの機能を利用してくださっているユーザがこの機能で推薦された人物に興味があるのか否かの情報も利用して推薦の精度向上を行なっています。社内にある人脈を活用することで営業のチャンスが広がるということがあるかもしれません。

画像処理分野の事例

画像処理分野の応用事例としては「SRGANを利用した超解像技術の応用」の話をしました。弊社のプロダクト「Sansan」と「Eight」では、いずれも画像として入ってくる名刺をデータ化する処理があります。この処理ではOCR技術と人力の両方を活用しているわけですが、入ってくる画像の解像度はまちまちであり、非常に解像度が悪い画像も流入してきます。そこで、OCRで読み取りやすいように、また、人が目を凝らさずとも判別しやすいようにするために超解像技術が利用できないかということで、このような研究開発を行っています。

公開データについて

先に少し述べましたが、弊社ではNIIの情報学研究データリポジトリでデモ名刺データを公開しています。こちらは、各文字列の領域を示す矩形の位置情報と、その領域が表す項目情報(氏名なのか住所なのかなど)が学習データとして与えられています。
ちなみに、11月28日にIDR (情報学データリポジトリ) ユーザフォーラムがNIIで開催され、情報学データリポジトリで公開されているデータを利用して研究を行なった方に発表していただくポスターセッションがありますので、もし弊社データを使って研究したい方やされている方がいらっしゃいましたら、是非こちらでの発表をお待ちしております。

f:id:ssatsuki040508:20180919174725j:plain
こちらは発表の様子です。多くの方にSansanの取り組みについての話を聞いていただくことができました。ご参加くださった皆様、ありがとうございました。

ブース展示

前回同様ブース展示も行い、テクノロジーショーケースの発表を聞いて興味を持ってくださった方が、多く訪れてくださいました。特に「社会科学」での一例として取り上げた「名刺交換と営業成績との関係」についての話と、「レコメンド」の一例で取り上げた「スマートレコメンデーション」の話について興味を持ってくださった方が多かったです。

f:id:ssatsuki040508:20180919181553j:plain

こちらはDSOC Tシャツを着てブース対応をしている吉村(左)と人事部田中(右)です。

ポスターレセプション

初日の最後にはポスターレセプションもありました。ポスターレセプションはいわゆるポスター発表とバンケットを足したような場で、参加者の皆さんは楽しく食事をしながらポスター発表を聞いていらっしゃいました。この場では、学生の方の研究や、他の企業の技術事例などについてもたくさんのお話を聞かせていただきました。もちろん、弊社も聞くだけでなく、ポスター発表をする側としても参加しました。今回のポスター発表では、弊社のコア技術である名刺のデータ化フローに重点を置いてお話しさせていただきました。名刺を正確にデータ化することへの弊社の熱い想いを伝えられて良かったです。話を聞きに来てくださった、たくさんの企業や学生のみなさんありがとうございました。

f:id:ssatsuki040508:20180919181556j:plain
こちらは、私が学生さんに話をしている様子です。Sansanのことについてより知っていただけたのではないでしょうか。

最後に

Sansanでは今回のWeb DB Forumでお話させていただいた内容の他にも様々な技術を「ビジネスの出会いを資産に変え、働き方を革新する」ために活用しています。「ネットワーク分析」、「文字認識」、「クラウドソーシング」、「データ分析基盤」などを専門とするメンバーもそれぞれの強みを生かした研究開発に取り組んでいますので、今後もどんどんいろんな場で登壇して弊社の技術について話していきたいと思っています。

また、R&Dのメンバーも募集しておりますので、ご興味がある方はご連絡いただけると嬉しいです。


新卒の方はこちら
中途の機械学習・AI研究者の方はこちら
中途のデータエンジニアの方はこちら

© Sansan, Inc.