こんにちは、研究開発部のライです。
2026年6月8日(月)から6月12日(金)にGメッセ群馬で開催される人工知能学会全国大会(JSAI2026)に、Sansan株式会社はプラチナスポンサーとして協賛し、ブース出展および発表を行います。Sansanからは、ポスター発表2件と口頭発表1件を行います。
本記事では各発表の概要と、ブースについて紹介します。
ポスター発表
① RT-QMC: 順序変換を用いた準モンテカルロサンプリングによるロバストな初期学習データ選択
RT-QMC: Robust Initial Training Data Selection via Rank-Based Transformation and Quasi-Monte Carlo Sampling
- 発表者:田柳 俊和
- セッション会場:Y会場(展示ホールAB-1)
- セッション日時:2026年6月8日(月)16:10 ~ 17:40
- 講演番号:1Yin-B-10
概要
事前学習モデルの特徴空間を活用し、ラベル付け前データから効率的にサンプルを選定する手法「Rank-Transformation Quasi-Monte Carlo(RT-QMC)」を提案しました。
② スキャン文書画像を用いたページ欠落検出手法の検討
A Study on Methods for Detecting Missing Pages Using Scanned Document Images
- 発表者:宮本 優一、吉村 皐亮
- セッション会場:Y会場(展示ホールAB-1)
- セッション日時:2026年6月8日(月)16:10 ~ 17:40
- 講演番号:1Yin-B-21
概要
スキャンされた文書画像を入力とし、画像情報そのものやOCR結果を活用することで、人的誤りによるページ欠落を検出する複数のアプローチを提案し評価しました。
口頭発表
GITによる複数ページ請求書の文脈を考慮したページ単位画像分類
Context-Aware Page-Level Image Classification of Multi-Page Invoices Using GIT
- 発表者:ライ シンユ、本田 悠太郎
- セッション名:非構造データからの情報抽出(OS-19)
- セッション会場:F会場(メインホールB)
- セッション日時:2026年6月9日(火)15:30 ~ 15:45
- 講演番号:2F5-OS-19a-01
概要
複数ページからなる請求書に対し、ページ間の文脈と順序を考慮した画像分類手法を提案します。GITの動画キャプショニングの枠組みを応用し、複数ページを同時に入力して分類ラベル列を生成する手法を提案し評価しました。
ブース出展
ブース位置:ポスター・展示会場(B会場付近)
会期中は企業ブースの出展も予定しています。
プロダクトにおけるAI活用事例や研究開発の取り組みをご紹介予定です。現場のエンジニア・研究員とも直接お話しいただけますので、ぜひお気軽にお立ち寄りください。ブースではオリジナルノベルティーもご用意しています!
学会に参加される方は、ぜひ発表・ブースともにお越しいただけるとうれしいです。現地でのディスカッションを楽しみにしています!
Sansan技術本部ではカジュアル面談を実施しています!
Sansan技術本部では中途の方向けにカジュアル面談を実施しています。 Sansan技術本部での働き方、仕事の魅力について、現役エンジニアの視点からお話しします。 「実際に働く人の話を直接聞きたい」「どんな人が働いているのかを事前に知っておきたい」とお考えの方は、ぜひエントリーをご検討ください。