Sansan Tech Blog

Sansanのものづくりを支えるメンバーの技術やデザイン、プロダクトマネジメントの情報を発信

AWS

OpenSearchCon Japan 2025に参加してきました!

こんにちは!Eight Engineering Unit Platformグループで名刺アプリ「Eight」のSREをしている中鉢です。2025年12月11日、東京虎ノ門で開催された OpenSearchCon Japan 2025 に参加してきました。OpenSearchConは2022年から世界的に開催されているカンファレ…

GCS→S3キャッシュプロキシで大規模ML学習のデータ転送コストを削減した話

はじめに 技術本部 研究開発部 Architectグループで1カ月強インターンをしていた金古侑大です。*1 Architectグループでは、研究開発に関連するインフラの設計、開発、運用をしています。今回のインターンでは、マルチクラウド環境でのデータ取得コストを削減…

EightからEC2インスタンスを撲滅した話

最近ゴルフを始めて打ちっぱなしに通うようになり、野球部だった中学生ぶりに手の皮が剥けました、Eight Engineering Unit Product Dev Groupの平石です。今回はEightで行ったEC2インスタンス撲滅の取り組みについてお話しします。なお本記事は Sansan Adven…

OpenSearchのDynamic mapping仕様検証

この記事はSansan Advent Calendar 2025の17日目の記事です。 こんにちは。 技術本部 Sansan Engineering Unit Infrastructureグループで プロダクトインフラエンジニアをしている渡邉です。 最近は息子と一緒にウルトラマンオメガにハマっています。 本当な…

Amazon EMR で Apache Iceberg v3 の Deletion Vectors を検証してみた。

この記事はSansan Advent Calendar 2025 - Adventarの15日目の記事ですSansan Engineering Unit Infrastructureグループの織田繁です。Amazon EMR 7.12 で Apache Iceberg v3 テーブルフォーマットがサポートされたので、AWS/Iceberg好きとして調べてみまし…

コーポレートシステム部の週報作成を自動化した話ーSlackログの収集からNotionへのアウトプットまで

1. はじめに 2. 背景・課題 2-1. 「今週なにやった?」が見えない問題 2-2. 手作り週報の限界 3. 作ったもの/取り組みの概要 3-1. 週報アプリでやりたいこと 3-2. 全体アーキテクチャ(図解) 4. 技術的なポイント 4-1. Slackエクスポート → DuckDBで“検索…

Vertex AI Grounding を使ってキャリアサマリーを自動生成した

こんにちは!名刺アプリ「Eight」の開発チームでバックエンドエンジニアをしている大久保です。最近はゴルフにハマっています。 今回は、Eightに初めて導入したAI機能である、「キャリアサマリー自動生成」のアーキテクチャと環境構築やAPIリクエストについ…

Amazon Athena で json、Parquet、Iceberg のデータを検索し、性能比較してみた

Sansan Engineering Unit Infrastructureグループの織田 繁です。 2025 年 6 月 25 日~ 26 日に開催された AWS Summit Japan 2025 での Community Stage にて「Amazon S3 標準/S3 Tables/S3 Express One Zone を使ったログ分析」というタイトルで登壇させて…

CursorとPlaywright MCP Serverを活用したJMeterの負荷シナリオ生成

導入 こんにちは!名刺アプリ「Eight」のSREエンジニアの藤原です。SREは日々プロダクトの信頼性向上に向き合っています。私は2024年の8月に入社し、すでに入社から1年経ったことに驚きを隠せない今日この頃です。遅ればせながらドラゴンクエストIIIリメイク…

AWS Step Functionsで本番リリース作業を完全自動化した話

はじめに こんにちは!名刺アプリ「Eight」のエンジニアをしている常盤です。現在はEnhancementチームに所属し、Eightの設計や開発生産性の改善に日々取り組んでいます。 Eightでは週2回の定期リリースを行っていますが、以前はリリース担当者が10回以上の手…

Amazon ElastiCache for RedisからAmazon ElastiCache Serverless for Valkeyへ移行した話

導入 こんにちは。2024年8月に名刺アプリ「Eight」のSREエンジニアとして、Sansan株式会社へ入社した技術本部 Eight Engineering Unit Platformグループの藤原です。日々プロダクトの信頼性に向き合っています。本記事では、Web版Eightのセッション管理で活…

Amazon S3メタデータのサイズ制限に対するエンコーディング戦略

イントロダクション 課題の背景: S3のメタデータに保存できない 技術的な制約:メタデータの制限とエンコード方式 解決策の提案: エンコード方式の変更 学んだ教訓 まとめ Sansan技術本部ではカジュアル面談を実施しています 参考 イントロダクション みなさ…

KEDAを導入してAWS SQSキューとHTTPリクエストベースのスケーリングを実現する

こんにちは、年始に研究開発部ArchitectグループからSPEU(Strategic Products Engineering Unit) SREグループに異動したジャン(a.k.a jc)です。 本記事では、異動前に研究開発部Architectグループが開発・運用している、Circuitと呼ばれるKubernetes基盤…

Eightの検索機能をCloudSearchからOpenSearchに移行して得たもの

こんにちは!技術本部Eight Engineering Unitでサーバーサイドエンジニアをしている常盤です。 名刺アプリ「Eight」では最近、検索機能のうち2つをAmazon CloudSearchからAmazon OpenSearch Serviceに移行しました。今回は、移行した背景やそのメリットを紹…

FireLens(Fluentd)を使った大容量ログ配信時に起きた問題と調査の足跡

まえがき 名寄せログ収集プロジェクトのゴール 名寄せログ配信アーキテクチャ Before After A. Fluentd上の名寄せログgzip圧縮 概要 発生した問題 ログが伸張できなくなる原因 結論 余談 ECS Execを使ったデバッグ B. TCPソケットを利用したFluentdへの名寄…

Railsのマイクロサービスアーキテクチャで構成されたアプリをモノレポ構成に移行した話

こんにちは。技術本部Sansan Engineering Unit Master Data Groupの古本です。 普段は、営業DXサービス「Sansan」の名刺交換した人や企業に関するニュースを表示し、お知らせする「企業ニュース」や「企業情報」を扱うシステムの開発をしています。最近、マ…

インボイス管理サービス「Bill One」の認証を内製認証基盤に置き換えて認証基盤のコストを削減した話

Bill One Engineering Unit 共通認証基盤チームの樋口です。 Bill Oneでは昨年までAuth0を認証基盤として利用してきましたが、認証基盤を内製化することでコストを大幅に削減しました。 この認証基盤は、昨年12月に無事リリースされ、Bill Oneの認証を支えて…

【R&D DevOps通信】Google Compute Engine + GPUで動作するMLサービスの基盤を刷新した話(技術選定編)

技術本部 研究開発部 Architectグループの島です。見習い12年目です。 今回は、当社のデータ化技術の粋である「NineOCR」について、そのインフラ・デプロイの基盤を刷新したお話をします。NineOCRに関しては、以下の記事などをご参照ください。 buildersbox.…

Firehoseを介したS3への中間データ保管と検索性強化

はじめに こんにちは、研究開発部 Architectグループの辻田です。 SansanではユーザーフィードバックがSlackのフィードバックチャンネルに集まります。研究開発部ではこれらからモデルやアルゴリズムなどの改善をしています。 そのため、より多くのフィード…

Eightのデータ抽出基盤をサーバーレスで作る際に工夫したこと

こんにちは、Eight Engineering Unitの井上です。 Eightのデータ抽出基盤である Data Management Platform(以下、DMP)の開発を担当しています。 はじめに Eightは330万人を超えるユーザーにご利用いただいており、お預かりしているデータ量も日々多くなっ…

AWS Glueを使ってバッチ処理を60倍高速化した話

初めまして、技術本部Digitization部データ化グループ所属の高田です。 今回はAWS GlueのJobを使ってバッチ処理を60倍高速化した話をします。 この記事は以下の内容を共有しています。 AWS Glueの概要とメリット Apache Sparkの概要とメリット Pythonを使っ…

re:invent 2023参加報告: Amazon Aurora Limitless Database

Sansan Engineering Unit Infrastructure グループの落合と申します。 こちらのSansan Tech Blogは初投稿となります。コロナ禍以降、カンファレンスはオンラインで見られるのが普通になり海外イベントに現地参加することはもうなくなるのだろうな、とばかり…

Platformのエンジニアが行くAWS re:Invent 2023 - EKSで実現するマルチテナントSaaS編

こんにちは、技術本部研究開発部 ML Platformチームの神林です。前回はEKSのBreakout Sessionの中で気になる一部分を掘り下げてみました。 buildersbox.corp-sansan.com AWS re:Invent 2023も無事に終わりました。開催中にもう何個か記事を書きたかったので…

インフラエンジニアがre:Invent 2023に参加して面白かったセッション4選

Sansan Engineering Unit Infrastucture グループの藤田です。先日開催された AWS re:invent 2023 に参加してきました。今回はその中で聴講したセッションの中から特に印象に残ったものを紹介します。

GCP のログを Amazon S3 へ集約する仕組みを作った話

こんにちは!技術本部情報セキュリティ部 CSIRT グループ所属の吉山です。 普段は社員の方々からのセキュリティに関する報告・相談の対応や、ログの収集・検知を行う SIEM 基盤の開発・運用などに向き合っています。 今回は、SIEM 基盤へ GCP の各サービスが…

Platformのエンジニアが行くAWS re:Invent 2023 - Pod Identity編

こんにちは、技術本部研究開発部 ML Platformチームの神林です。前回は技術とは関係ないULパッキングの記事を書きました。あまりにも関係なさすぎたので、今回は技術の方に振り戻そうと思います。 buildersbox.corp-sansan.com AWS re:Invent 2023も後半戦と…

Platformのエンジニアが行くAWS re:Invent 2023 UL海外出張 準備編

こんにちは、技術本部研究開発部 ML Platformの神林です。ML PlatformチームではCircuitというアプリケーション基盤を作っています。 さて、今年もアメリカのラスベガスで開催されるAWS re:Inventの時期がやってきました。私も社内で声をかけてもらったので…

Slackアプリで勤怠を申請できるようにしました

こんにちは、コーポレートシステム部 Corporate ITグループのあおしょーこと青松です。 普段はSREチームのDevOpsエンジニアとして社内の業務改善を担当しています。 ありがたいことに弊社では急成長とともに従業員も増えつつあるのですが、それと同時に社内…

自社OCRエンジン「NineOCR」の学習効率化のため SageMaker Training を導入した話

はじめに NineOCR とは NineOCR が抱える課題 Amazon SageMaker Training とは SageMaker Training の始め方 事前準備 AWS が提供しているコンテナイメージを拡張する方法 独自のコンテナイメージに SageMaker Training Toolkit をインストールする方法 スク…

【R&D DevOps通信】Amazon ECSのTips

こんにちは、R&D Architectグループの辻田です。ECS on EC2のアーキテクチャでサービスを構築する機会があったので、そこで得た知見をTips形式でまとめたいと思います。

© Sansan, Inc.