Sansan Tech Blog

Sansanのものづくりを支えるメンバーの技術やデザイン、プロダクトマネジメントの情報を発信

R&D

GENIAC における ParallelCluster GPU クラスタの構築記録

Sansan株式会社 研究開発部Architect GroupでMLOps/Platformエンジニアをしている伊藤です。 今回は、GENIACに採択され、AWS上にSlurmによるGPUクラスタを構築した経験から、事前に知っておきたかったポイントをまとめます。構築中に遭遇した課題と、そのと…

言語処理学会第32回年次大会(NLP2026)に参加しました

こんにちは。研究開発部の佐藤です。2026年3月9日(月)から3月13日(金)にかけて、栃木県のライトキューブ宇都宮にて言語処理学会第32回年次大会(NLP2026)が開催されました。弊社からは、プラチナスポンサーとして佐藤・齋藤・橋本・大田尾・Loem・根本の6名の…

「渋⾕ Biz × AI: ビジネスにおける AI 利活⽤ 事例勉強会 第4回」レポート

今回で4回目となった渋谷 Biz × AI 勉強会最近は家の近くにおいしいスパイスカレーのお店を見つけて良い気分です。研究開発部の吉村です。今回は、2026年2月16日にSansan株式会社で開催された、株式会社サイバーエージェント、株式会社ビズリーチ、Sansan株…

場所を理由に挑戦を諦めない。Sansanが地方拠点採用を強化する理由

年末に、新卒で東京に来て以来初めて引越しをしたCTOの笹川です。 引越し先も、引越し前と同じ都内ですが、今回は東京以外のSansanの地方拠点について書いてみようと思います(本題と関係ないですが、笹川は札幌出身です)。 Sansanには、渋谷にある本社オフ…

中央集権型の限界とデータメッシュの壁。Sansanのデータ分析基盤のこれまでとこれから

1. はじめに こんにちは。研究開発部 Data Direction Group(以下、DDG)の永井です。 Data Direction Groupブログリレー(全6回)の最終回のブログとなります。過去にナインアウト株式会社(旧 クリエイティブサーベイ株式会社)にてデータエンジニアとして…

AIエージェントのための段階的セマンティックレイヤの育て方

R&D

SansanのData Direction Groupの中村崚です。 前回、齊藤が「AgenticとWorkflowを"いい感じに"併用する」という設計論を書きました。探索寄りの依頼にはAgenticが強く、定型出力寄りの依頼にはWorkflowが強い、という話でした。 Data Direction Groupブログ…

営業支援AIエージェントで考えるAgenticとWorkflowの設計論

Data Direction Groupブログリレー3日目の記事です。2025年4月よりData Direction Groupにジョインした齊藤です。データエンジニアリングやアナリティクスなどをやりつつ、その延長線上でAIエージェント開発に取り組んでいます。前回記事では、データエンジ…

データから収益を生み出す挑戦。Sansanの独自資産を武器に、本気でAIエージェントを作りに行く話

はじめに:なぜ今、Sansanでデータをやるのか こんにちは。研究開発部 Data Direction Group(以下、DDG)の坂口です。 Data Direction Groupブログリレー(全6回)の記念すべき1つめのブログとなります。2023年9月に入社し、現在は全社横断のデータ基盤開発…

PythonのGILとはなんだったのか

本記事はSansan Advent Calendar 2025、23日目の記事です。 こんにちは、技術本部研究開発部の川波です。 2025年10月にPython 3.14の正式版がリリースされ、GILなしのPythonである「Free-threaded Python」が正式サポートされることになりました。 年の瀬と…

GitHub Enterprise移行のために研究開発部でやったこと

本記事はSansan Advent Calendar 2025、1日目の記事です。 こんにちは、技術本部研究開発部の高橋寛治です。 会社としてGitHubからGitHub Enterpriseへの移行が行われました。 会社として移行ガイドの用意があり、GitHub Enterprise Importerのドキュメント…

社内イラスト制作を支援する画像生成AIツールの研究開発

1. はじめに 法政大学情報科学研究科修士1年の立川駿と申します!大学院ではCGや深層学習を研究しており、研究テーマとの親和性が高いことから、SansanのR&Dインターンに参加しました。インターンでは社内イラスト生成のAI開発に取り組みましたので、企業のA…

第20回言語処理若手シンポジウム(YANS2025)に参加しました!

こんにちは。研究開発部の25卒新卒、根本です。2025年9月17日(水)から19日(金)の3日間、静岡県浜松市のアクトシティ浜松にて第20回言語処理若手シンポジウム(YANS2025)が開催されました。弊社からは私が現地参加し、ポスター発表をしました。本ブログ…

Vertex AIを利用してVision Language Modelをリリースするまでの意思決定

はじめに こんにちは、技術本部 研究開発部Automationグループの石井です。 本記事では、内製のVision Language Model “Viola”をGoogle CloudのVertex AIにデプロイするまでに行った意思決定を振り返ります。 比較的大きなVision Language Modelを本番環境に…

YAML Anchorsを活用したGitHub Actionsの効率化とその限界

技術本部 研究開発部 Architectグループの島です。 GitHub ActionsでYAML Anchorsがサポートされました。 github.com これにより、ワークフローの記述において冗長な繰り返し(ボイラープレート)コードをいくらか改善できます。この記事では、YAML Anchors…

MIRU2025にゴールドスポンサーとして参加します

こんにちは、研究開発部の竹長です。 昨年までは学生として参加していましたが、今回は出展側として初めて関わるMIRUがどんなふうに映るのか、今から楽しみです。 Sansan株式会社は、2025年7月29日(火)〜 8月1日(金)に国立京都国際会館にて開催される「…

帳票VQAの舞台裏:どうやってモデルを育ててきたか

こんにちは。研究開発部のMengsay Loemです。現在は、帳票から情報を抽出・構造化する「データ化技術」の研究開発に取り組んでいます。本記事では、Sansanにおける、Vision-Language Model(VLM)を用いた視覚的質問応答(VQA)による帳票からの情報抽出技術…

2025年度 人工知能学会全国大会(第39回)参加報告

こんにちは、Sansan株式会社 技術本部 研究開発部の田柳です。2025年5月27日(火)〜30日(金)の4日間、大阪国際会議場(グランキューブ大阪)にて開催された 2025年度 人工知能学会全国大会(JSAI2025)に参加してきました。弊社はプラチナスポンサーとし…

フルスクラッチ VLM “Viola” の歩み

はじめに こんにちは、研究開発部の石井です。 この記事では、弊社が文書画像からの高精度な情報抽出を目指し、フルスクラッチで開発した視覚言語モデル(Vision Language Model) “Viola” の歩みを共有します。 開発に至った背景から、技術選定の試行錯誤、…

Vision Language Modelの統合で汎用化はできるのか?タスク横断マージを試す

こんにちは。研究開発部のMengsay Loemです。現在は、帳票などの文書画像から情報を抽出・構造化する「データ化技術」の研究開発に取り組んでいます。本記事ではその中でも、視覚言語モデルを活用したアプローチに注目し、特に異なる情報抽出に特化したVLM(…

TorchServe が Limited Maintenance になったので移行するサービングライブラリを検討した

はじめに こんにちは、研究開発部の石井です。 いきなり本題ですが、TorchServe をご存知でしょうか。 github.com PyTorch 公式のリポジトリに所属する、PyTorch のモデルを本番環境でサービングするためのライブラリです。 この TorchServe ですが 2025 年 …

言語処理学会第31回年次大会(NLP2025)に参加しました

こんにちは。研究開発部の大田尾です。2025年3月10日(月)から3月14日(金)にかけて、長崎県の出島メッセ長崎にて言語処理学会第31回年次大会(NLP2025)が開催されました。弊社からは、プラチナスポンサーとして大田尾・齋藤・橋本・保坂・Loemの5名のメンバー…

【インタビュー】中部で始まる新たな挑戦。宮地 宏一さんに聞く

Sansanの中部支店に新たなメンバーが加わります。本社での経験を経て、地元・愛知への思いを胸に異動を決めた宮地さん。彼がどのような経緯で中部支店への異動を決意し、これからどんな挑戦を描いているのか。同じく中部支店で勤務し、宮地さんが所属するチ…

やたら長いバッチの実行時間を大幅に削減した話

【ブログを公開しました】 #33Tech #Sansan技術本部 #Sansan

【R&D DevOps通信】Google Compute Engine + GPUで動作するMLサービスの基盤を刷新した話(完結編)

技術本部 研究開発部 Architectグループの島です。 前回の記事の続きで、完結編です。Sansan内製の名刺OCRである「NineOCR」の基盤を改良します。 buildersbox.corp-sansan.com 筆が進まないまま前編から1年経ちそうで慌てて書いている次第ですが、そうこう…

【Sansan Tech Talk】研究開発部のSRE戦略 〜MLアプリケーションの進化と保守性向上⁠〜

こんにちは、Sansan Engineering Unit 部長の笹川裕人です。今回で8回目を迎える「Sansan Tech Talk」では、Sansanのテックリードが日々取り組んでいる技術的な課題や挑戦を深掘りしてお届けしています。今回は、研究開発部のArchitectグループで活躍する加…

バージョンが多すぎるYOLOについて語りたい

本記事はSansan Advent Calendar 2024、18日目の記事です。

DatadogでKubernetes(EKS)のMetricsを取得する備忘録

こんにちは!技術本部 研究開発部 Architectグループの宮地です。1年ぶりのブログ投稿になります。私は23卒として入社し、気づけば 2年目も終わりに近づいています。月日の流れは本当に早いですね。 さて、最近のトピックスとして、年明けから中部支店に異動…

機械学習実験管理ツールの移行検討

こんにちは、技術本部 研究開発部 ML Platformチームでインターンをしていた岡部です。ML Platformチームでは、主に社内の研究員の成果を高速にリリースするための基盤であるCircuitの開発・運用を行っています。 CircuitはEKSをベースとしたシステムで、シ…

Argo CDとArgo Workflowsにおける認証・認可の設定

こんにちは、研究開発部 Architectグループ ML Platformチームのジャン(a.k.a jc)です。 本記事はSansan Advent Calendar 2024の15日目です。 Argo CDとArgo Workflowsにおける認証・認可の設定について紹介します。

BigQueryのストレージ課金モデルの自動最適化

研究開発部の田仲です。 本記事は、Sansan Advent Calendar 2024の3日目の記事です。 背景 どちらの課金モデルが適しているかを判断する 自動的に安い方にする 処理概要 ポイント まとめ

© Sansan, Inc.