こんにちは。研究開発部の保坂です。
昨年末は久しぶりに年賀状を書いたのですが、最近は年賀状アプリも発達しており、作り始めて30分程度で発送まで手配できたことに感動しました。そのような中、2023年12月22日(金)に、東京大学の伊藤謝恩ホールにて、株式会社サイバーエージェント主催のCCSE2023が開催されました。弊社からは計9名が現地に赴き、口頭発表1件とコラボトーク1件に登壇をしました。
本記事は、CCSE2023への参加レポートになります。
CCSE
CCSE(Conference, on Computer Science for Enterprise)について、公式サイトに分かりやすい説明があるので、以下に抜粋します。
企業研究所では自社サービスの発展やイノベーションを起こすための研究が行われています。
CCSEは所属企業の枠を超え、企業が行った研究を学会のように発表議論する場として存在します。そして企業の研究者が「自社の研究を他社や学生と議論し、研究を発展させること」、聴講者の皆さんに「共同研究や自分のキャリアについて考えるきっかけを提供すること」を目的に各企業から有志メンバーが集まり企画/運営を行っています。
CCSEに参加されることでマシンラーニングやコンピュータビジョンなどのAI技術や、ロボット、IoT技術など、幅広い領域の研究について一日で触れることができます。
つまり、いわゆる学会に近い形で、企業の行っている取り組みについて発表や議論を行うカンファレンスがCCSEです。学術的な観点だけでなく、サービス応用や企業戦略などの企業ならではのテーマも盛んに議論されていることが印象的でした。
CCSEは2018年に初めて開催され、2020年、2021年はコロナウイルスの影響でオンラインの開催となっています。続く2022年は開催されなかったため、CCSE2023は実に4年ぶりのオフライン開催となりました。
企業ブース
CCSEでは13の企業が企業ブースを開いていました。弊社からは、口頭発表の内容でもある Contract One における契約書解析技術の開発だけでなく、Sansan Labs*1 上でのLLM活用やグループ企業であるlogmiでの作業スケジューリング自動化など、多岐にわたるトピックを紹介しました。
また、現地には Sansan Labs のデモも展示し、研究開発部の取り組みの結果としてどのような機能がリリースされているのかを実際に触って体感していただけました。
また、CCSEでは Ask the Speaker を採用しており、口頭発表の登壇者がブースにいるため、発表後にもより深い議論をすることができます。実際に私も登壇し、聴講していた多くの方と議論をしたのですが、類似したドメインのデータを解析している方と知見を共有したり、企業における研究開発の難しさについて雑談したりと、さまざまなトピックについて話すことができたと思います。
登壇内容
弊社からは、1件の口頭発表と、1件のコラボトークに登壇をしました。自然言語処理領域の取り組みや、発展してLLM活用の取り組みについて話しました。登壇した内容についても簡単に紹介したいと思います。
Contract One における契約書解析技術の開発
私保坂より、契約DXサービス Contract One における研究開発の取り組みについて話しました。サービスの根幹となる契約書データ化システムを改善するために文書クラスタリングを導入したり、LLMを活用してアプリケーションの新機能を開発したりと、技術をサービスに応用して組み込んでいく立場での取り組みを紹介しました。
そしてこの発表で致命的なミスをしてしまったのですが、発表資料のサイズがスクリーンのサイズに合っていないままプレゼンテーションをしてしまいました...
聴講していた方で資料が見えづらかった方には申し訳ないです。発表資料は以下にも公開しておりますので、ご興味ある方がいれば、ぜひご覧ください。
コラボトーク:生成AIの戦略と現状
コラボトーク「生成AIの戦略と現状」にスピーカーとして猿田が登壇しました。LLMにまつわる取り組みを行っている企業が、現状の取り組みや今後の戦略について議論を行うという内容でした。
特に、現状でLLMの自社開発を行っている企業と、自社開発を行わずにLLMの活用に力を入れている企業が異なる立場から議論を行っていたため、多くの聴講者が参考になったセッションなのではないかと感じました。
コラボトークでは下記のようなテーマを取り上げて話しました。
- 自社でLLMって開発してる?
- 生成AIシステム開発中にぶつかった問題とその解決方法
- 生成AIの最新動向と将来の展望
Sansanでは現在のところ自社でLLMの開発は行っていませんが、OCR開発のなかでVision&Languageモデルの検証などは行っています。生成AIシステム開発時の課題については要件定義および品質テストや監視の課題について取り上げさせていただきました。また、将来の展望については組織内のありとあらゆるドキュメントがAIによって検索可能になる未来や個々のデータを守る技術やサービスが出てきそうといったことを発言させていただきました。国内のGPU支援や個々のタスクに特化したLLMが出てくるだろうといったコメントが興味深かったです。
まとめ
本記事では、CCSE2023における弊社の取り組みを紹介しました。
企業で働く研究者として、基礎研究によった話からサービス応用、共同研究や組織マネジメントなどの幅広いトピックについて一日で聴講、議論できる機会は貴重だと思いました。また、学生の方も参加しており、企業における研究でどのような活動が行われているかのイメージに繋がったのではないかと思います。
私はオンライン開催のCCSE2020にも登壇していたのですが、今回はオフライン参加ということで、久しぶりにカンファレンス特有の雰囲気を感じることができて率直に楽しかったです。
最後に、Sansanでは一緒に働く仲間を募集しています。Sansanの研究内容やビジネスにご興味ある方は、ぜひ以下のリンクより募集ポジションや関連記事をご覧ください。
*1:Sansan Labs とは、Sansan上で、実験的な機能を提供するサービスです。最近では、LLMを活用した機能も多く組み込んでいます。