Sansan Tech Blog

Sansanのものづくりを支えるメンバーの技術やデザイン、プロダクトマネジメントの情報を発信

R&D

PythonのGILとはなんだったのか

本記事はSansan Advent Calendar 2025、23日目の記事です。 こんにちは、技術本部研究開発部の川波です。 2025年10月にPython 3.14の正式版がリリースされ、GILなしのPythonである「Free-threaded Python」が正式サポートされることになりました。 年の瀬と…

GitHub Enterprise移行のために研究開発部でやったこと

本記事はSansan Advent Calendar 2025、1日目の記事です。 こんにちは、技術本部研究開発部の高橋寛治です。 会社としてGitHubからGitHub Enterpriseへの移行が行われました。 会社として移行ガイドの用意があり、GitHub Enterprise Importerのドキュメント…

社内イラスト制作を支援する画像生成AIツールの研究開発

1. はじめに 法政大学情報科学研究科修士1年の立川駿と申します!大学院ではCGや深層学習を研究しており、研究テーマとの親和性が高いことから、SansanのR&Dインターンに参加しました。インターンでは社内イラスト生成のAI開発に取り組みましたので、企業のA…

第20回言語処理若手シンポジウム(YANS2025)に参加しました!

こんにちは。研究開発部の25卒新卒、根本です。2025年9月17日(水)から19日(金)の3日間、静岡県浜松市のアクトシティ浜松にて第20回言語処理若手シンポジウム(YANS2025)が開催されました。弊社からは私が現地参加し、ポスター発表をしました。本ブログ…

Vertex AIを利用してVision Language Modelをリリースするまでの意思決定

はじめに こんにちは、技術本部 研究開発部Automationグループの石井です。 本記事では、内製のVision Language Model “Viola”をGoogle CloudのVertex AIにデプロイするまでに行った意思決定を振り返ります。 比較的大きなVision Language Modelを本番環境に…

YAML Anchorsを活用したGitHub Actionsの効率化とその限界

技術本部 研究開発部 Architectグループの島です。 GitHub ActionsでYAML Anchorsがサポートされました。 github.com これにより、ワークフローの記述において冗長な繰り返し(ボイラープレート)コードをいくらか改善できます。この記事では、YAML Anchors…

MIRU2025にゴールドスポンサーとして参加します

こんにちは、研究開発部の竹長です。 昨年までは学生として参加していましたが、今回は出展側として初めて関わるMIRUがどんなふうに映るのか、今から楽しみです。 Sansan株式会社は、2025年7月29日(火)〜 8月1日(金)に国立京都国際会館にて開催される「…

帳票VQAの舞台裏:どうやってモデルを育ててきたか

こんにちは。研究開発部のMengsay Loemです。現在は、帳票から情報を抽出・構造化する「データ化技術」の研究開発に取り組んでいます。本記事では、Sansanにおける、Vision-Language Model(VLM)を用いた視覚的質問応答(VQA)による帳票からの情報抽出技術…

2025年度 人工知能学会全国大会(第39回)参加報告

こんにちは、Sansan株式会社 技術本部 研究開発部の田柳です。2025年5月27日(火)〜30日(金)の4日間、大阪国際会議場(グランキューブ大阪)にて開催された 2025年度 人工知能学会全国大会(JSAI2025)に参加してきました。弊社はプラチナスポンサーとし…

フルスクラッチ VLM “Viola” の歩み

はじめに こんにちは、研究開発部の石井です。 この記事では、弊社が文書画像からの高精度な情報抽出を目指し、フルスクラッチで開発した視覚言語モデル(Vision Language Model) “Viola” の歩みを共有します。 開発に至った背景から、技術選定の試行錯誤、…

Vision Language Modelの統合で汎用化はできるのか?タスク横断マージを試す

こんにちは。研究開発部のMengsay Loemです。現在は、帳票などの文書画像から情報を抽出・構造化する「データ化技術」の研究開発に取り組んでいます。本記事ではその中でも、視覚言語モデルを活用したアプローチに注目し、特に異なる情報抽出に特化したVLM(…

TorchServe が Limited Maintenance になったので移行するサービングライブラリを検討した

はじめに こんにちは、研究開発部の石井です。 いきなり本題ですが、TorchServe をご存知でしょうか。 github.com PyTorch 公式のリポジトリに所属する、PyTorch のモデルを本番環境でサービングするためのライブラリです。 この TorchServe ですが 2025 年 …

言語処理学会第31回年次大会(NLP2025)に参加しました

こんにちは。研究開発部の大田尾です。2025年3月10日(月)から3月14日(金)にかけて、長崎県の出島メッセ長崎にて言語処理学会第31回年次大会(NLP2025)が開催されました。弊社からは、プラチナスポンサーとして大田尾・齋藤・橋本・保坂・Loemの5名のメンバー…

【インタビュー】中部で始まる新たな挑戦。宮地 宏一さんに聞く

Sansanの中部支店に新たなメンバーが加わります。本社での経験を経て、地元・愛知への思いを胸に異動を決めた宮地さん。彼がどのような経緯で中部支店への異動を決意し、これからどんな挑戦を描いているのか。同じく中部支店で勤務し、宮地さんが所属するチ…

やたら長いバッチの実行時間を大幅に削減した話

【ブログを公開しました】 #33Tech #Sansan技術本部 #Sansan

【R&D DevOps通信】Google Compute Engine + GPUで動作するMLサービスの基盤を刷新した話(完結編)

技術本部 研究開発部 Architectグループの島です。 前回の記事の続きで、完結編です。Sansan内製の名刺OCRである「NineOCR」の基盤を改良します。 buildersbox.corp-sansan.com 筆が進まないまま前編から1年経ちそうで慌てて書いている次第ですが、そうこう…

【Sansan Tech Talk】研究開発部のSRE戦略 〜MLアプリケーションの進化と保守性向上⁠〜

こんにちは、Sansan Engineering Unit 部長の笹川裕人です。今回で8回目を迎える「Sansan Tech Talk」では、Sansanのテックリードが日々取り組んでいる技術的な課題や挑戦を深掘りしてお届けしています。今回は、研究開発部のArchitectグループで活躍する加…

バージョンが多すぎるYOLOについて語りたい

本記事はSansan Advent Calendar 2024、18日目の記事です。

DatadogでKubernetes(EKS)のMetricsを取得する備忘録

こんにちは!技術本部 研究開発部 Architectグループの宮地です。1年ぶりのブログ投稿になります。私は23卒として入社し、気づけば 2年目も終わりに近づいています。月日の流れは本当に早いですね。 さて、最近のトピックスとして、年明けから中部支店に異動…

機械学習実験管理ツールの移行検討

こんにちは、技術本部 研究開発部 ML Platformチームでインターンをしていた岡部です。ML Platformチームでは、主に社内の研究員の成果を高速にリリースするための基盤であるCircuitの開発・運用を行っています。 CircuitはEKSをベースとしたシステムで、シ…

Argo CDとArgo Workflowsにおける認証・認可の設定

こんにちは、研究開発部 Architectグループ ML Platformチームのジャン(a.k.a jc)です。 本記事はSansan Advent Calendar 2024の15日目です。 Argo CDとArgo Workflowsにおける認証・認可の設定について紹介します。

BigQueryのストレージ課金モデルの自動最適化

研究開発部の田仲です。 本記事は、Sansan Advent Calendar 2024の3日目の記事です。 背景 どちらの課金モデルが適しているかを判断する 自動的に安い方にする 処理概要 ポイント まとめ

Cloud ComposerとCloud Run Jobsを組み合わせたデータパイプラインの構築

R&D

こんにちは。研究開発部 Architectグループの中村です。 本記事は、Sansan Advent Calendar 2024の2日目の記事です。 今回は、Cloud ComposerとCloud Run Jobsを組み合わせたデータパイプラインの実装について紹介します。

本番相当の環境でdbt runを安全に検証する

はじめに 開発環境のご紹介 dbt run テスト dbt run によって生成されたデータは一定期間で削除する必要がある 開発の影響があるモデルだけテストしたい GitHub Actions を使いたい まとめ はじめに こんにちは。技術本部研究開発部 Architectグループの田辺…

ArgoCD Image Updaterから内製ツールに移行した話

こんにちは、研究開発部 Architectグループ ML Platformチームでインターンをしていた上田です。 今回はCI/CDパイプラインで利用されていたArgoCD Image Updaterを内製ツールに移行した経緯について紹介します。

【Sansan Tech Talk】研究開発部のプラットフォーム戦略 〜マルチプロダクト環境における課題と展望〜

こんにちは、Sansan Engineering Unit 部長の笹川裕人です。今回で7回目を迎える「Sansan Tech Talk」では、Sansanのテックリードが日々取り組んでいる技術的な課題や挑戦を深掘りしてお届けしています。今回は、研究開発部で活躍するWebアプリエンジニアの…

EKSにおけるNamespaceごとにCloudWatchとEC2のコスト按分方法

研究開発部 Architectグループ ML Platformチームのジャン(a.k.a jc)です。今回はKubernetes(EKS)におけるコスト按分のお話しをします。 背景 2022年に弊社研究開発部でAWS EKS上にCircuitというアプリケーション基盤を導入しました。 speakerdeck.com より…

【Sansan Tech Talk】研究開発の技術的挑戦 〜MLOpsの推進による開発サイクル短縮と効率化の取り組み〜

こんにちは、Sansan Engineering Unitの部長を務める、笹川 裕人です。今回で6回目となる「Sansan Tech Talk」。この連載ではSansanのテックリードたちが日々直面している技術的な課題や挑戦を深掘りしてお伝えしています。 今回は研究開発部で活躍するWebア…

2024年 研究開発部 新卒開発研修 後編

こんにちは、研究開発部Architectグループの山本です。 前編に引き続き、新卒社員に対して行った研修を紹介したいと思います。 後編では、前編で開発したサービスを社内アプリケーション基盤にデプロイする内容となります。 前編はこちら buildersbox.corp-s…

Kubernetes上に負荷試験基盤を構築した話

R&D

こんにちは、研究開発部Architectグループ ML Platformチームの藤岡です。今回はKubernetes上に負荷試験基盤を構築したので、その取り組みについて紹介しようと思います。 目次 目次 背景 負荷試験基盤の要件 負荷試験ツールの選定 負荷試験基盤のシステム概…

© Sansan, Inc.