【Sansan Tech Talk】研究開発部のSRE戦略　〜MLアプリケーションの進化と保守性向上⁠〜

R&D MLOps インタビュー/対談連載

こんにちは、Sansan Engineering Unit 部長の笹川裕人です。今回で8回目を迎える「Sansan Tech Talk」では、Sansanのテックリードが日々取り組んでいる技術的な課題や挑戦を深掘りしてお届けしています。今回は、研究開発部のArchitectグループで活躍する加…

2024-12-18

バージョンが多すぎるYOLOについて語りたい

画像認識機械学習 R&D

本記事はSansan Advent Calendar 2024、18日目の記事です。

2024-12-17

DatadogでKubernetes（EKS）のMetricsを取得する備忘録

R&D Kubernetes

こんにちは！技術本部研究開発部 Architectグループの宮地です。1年ぶりのブログ投稿になります。私は23卒として入社し、気づけば 2年目も終わりに近づいています。月日の流れは本当に早いですね。さて、最近のトピックスとして、年明けから中部支店に異動…

#Kubernetes #DataDog #Observability

2024-12-16

機械学習実験管理ツールの移行検討

R&D インターン

こんにちは、技術本部研究開発部 ML Platformチームでインターンをしていた岡部です。ML Platformチームでは、主に社内の研究員の成果を高速にリリースするための基盤であるCircuitの開発・運用を行っています。 CircuitはEKSをベースとしたシステムで、シ…

2024-12-15

Argo CDとArgo Workflowsにおける認証・認可の設定

R&D Kubernetes

こんにちは、研究開発部 Architectグループ ML Platformチームのジャン(a.k.a jc)です。本記事はSansan Advent Calendar 2024の15日目です。 Argo CDとArgo Workflowsにおける認証・認可の設定について紹介します。

#Kubernetes #Argo CD #Argo Workflows

2024-12-03

BigQueryのストレージ課金モデルの自動最適化

R&D BigQuery 自動化 Google Cloud

研究開発部の田仲です。本記事は、Sansan Advent Calendar 2024の3日目の記事です。背景どちらの課金モデルが適しているかを判断する自動的に安い方にする処理概要ポイントまとめ

#BigQuery #コストの削減 #アドベントカレンダー

2024-12-02

Cloud ComposerとCloud Run Jobsを組み合わせたデータパイプラインの構築

R&D

こんにちは。研究開発部 Architectグループの中村です。本記事は、Sansan Advent Calendar 2024の2日目の記事です。今回は、Cloud ComposerとCloud Run Jobsを組み合わせたデータパイプラインの実装について紹介します。

#Google Cloud #R&D #Data Engineering

2024-12-01

本番相当の環境でdbt runを安全に検証する

R&D データ分析プロセス改善

はじめに開発環境のご紹介 dbt run テスト dbt run によって生成されたデータは一定期間で削除する必要がある開発の影響があるモデルだけテストしたい GitHub Actions を使いたいまとめはじめにこんにちは。技術本部研究開発部 Architectグループの田辺…

2024-11-14

ArgoCD Image Updaterから内製ツールに移行した話

R&D Kubernetes DevOps

こんにちは、研究開発部 Architectグループ ML Platformチームでインターンをしていた上田です。今回はCI/CDパイプラインで利用されていたArgoCD Image Updaterを内製ツールに移行した経緯について紹介します。

#Kubernetes #DevOps #R&D

2024-10-07

【Sansan Tech Talk】研究開発部のプラットフォーム戦略〜マルチプロダクト環境における課題と展望〜

R&D MLOps インタビュー/対談連載

こんにちは、Sansan Engineering Unit 部長の笹川裕人です。今回で7回目を迎える「Sansan Tech Talk」では、Sansanのテックリードが日々取り組んでいる技術的な課題や挑戦を深掘りしてお届けしています。今回は、研究開発部で活躍するWebアプリエンジニアの…

2024-09-04

EKSにおけるNamespaceごとにCloudWatchとEC2のコスト按分方法

R&D DevOps

研究開発部 Architectグループ ML Platformチームのジャン(a.k.a jc)です。今回はKubernetes(EKS)におけるコスト按分のお話しをします。背景 2022年に弊社研究開発部でAWS EKS上にCircuitというアプリケーション基盤を導入しました。 speakerdeck.com より…

2024-08-13

【Sansan Tech Talk】研究開発の技術的挑戦〜MLOpsの推進による開発サイクル短縮と効率化の取り組み〜

R&D MLOps インタビュー/対談連載

こんにちは、Sansan Engineering Unitの部長を務める、笹川裕人です。今回で6回目となる「Sansan Tech Talk」。この連載ではSansanのテックリードたちが日々直面している技術的な課題や挑戦を深掘りしてお伝えしています。今回は研究開発部で活躍するWebア…

2024-08-09

2024年研究開発部新卒開発研修後編

24 新卒開発研修新卒 R&D Kubernetes インフラ

こんにちは、研究開発部Architectグループの山本です。前編に引き続き、新卒社員に対して行った研修を紹介したいと思います。後編では、前編で開発したサービスを社内アプリケーション基盤にデプロイする内容となります。前編はこちら buildersbox.corp-s…

2024-07-25

Kubernetes上に負荷試験基盤を構築した話

R&D

こんにちは、研究開発部Architectグループ ML Platformチームの藤岡です。今回はKubernetes上に負荷試験基盤を構築したので、その取り組みについて紹介しようと思います。目次目次背景負荷試験基盤の要件負荷試験ツールの選定負荷試験基盤のシステム概…

#Kubernetes #K6

2024-07-25

2024年研究開発部新卒開発研修前編

24 新卒開発研修 R&D Python FastAPI 新卒

こんにちは、研究開発部Architectグループの山本です。昨年に引き続き、研究開発部の新卒社員向けに開発研修を行いました。今年の研修では、私自身が昨年受けた経験をもとに感じた改善点や部内での技術的なアップデートを踏まえて実施しました。昨年の記…

2024-07-05

blue/green戦略によるKubernetesクラスタ更新時にIstioの対応方法

R&D DevOps

研究開発部 Architectグループ ML Platformチームのジャン(a.k.a jc)です。前回弊チームのKAZYがKubernetesクラスタ更新時のマニフェスト差分をGitのブランチで吸収する方法を紹介しました。 buildersbox.corp-sansan.com 今回は解像度をあげてKubernetesク…

#DevOps

2024-06-07

2024年度人工知能学会に参加しました

R&D レポート

こんにちは！研究開発部の山内敏嗣です！浜松で行われた2024年度人工知能学会全国大会（第38回）において、企業ブースの出展、ポスター発表を行いました。本ブログでは、その様子について紹介します。

2024-06-06

ベイジアン操作変数法でA/Bテストをしよう

R&D 計量経済学社会科学新卒

こんにちは。4月に24新卒として入社しました、技術本部研究開発部の金髙です。大学院では政治学の研究をしていました。本記事では、筆者が2024年2月から約1カ月間の内定者インターン時代に取り組んだ内容の一部である「ベイジアン操作変数法を用いたA/Bテ…

2024-05-30

A/Bテストを推進しようとしている話

R&D データ分析プロセス改善

技術本部研究開発部の小松です。社内/社外向けのアプリケーション開発や、社内のデータ活用促進、学術研究に取り組んでいます。本稿では、Sansan社内でデータに基づく意思決定を浸透させるために、A/Bテストの活用を推進しようとしている取り組みについて…

2024-05-28

【前編】24新卒開発研修で新しいツールを導入した話〜Ruffの導入方法と使い方など〜

R&D 新卒

こんにちは、研究開発部 Automationグループで研究員をしている李です。業務として、Bill Oneの請求書情報に関する作業効率改善に従事しています。例年通り *1 *2 4月24日（水）～4月26日（金）で研究開発部（以下、R&D）内の技術研修を実施しました。開発…

2024-05-28

【後編】24新卒開発研修で新しいツールを導入した話〜pre-commit の導入方法と使い方など〜

R&D 新卒

こんにちは、研究開発部 Automationグループで研究員をしている李です。本ブログでは、前編に続き、新卒開発研修*1 *2に導入したpre-commitの使い方などを共有します。 *1:2023年研究開発部新卒技術研修 ~ 実践編 ~ - Sansan Tech Blog *2:2023年研究開…

2024-05-01

Kubernetesクラスタ更新時のマニフェスト差分をGitのブランチで吸収する

R&D Kubernetes

研究開発部 Architectグループ ML PlatformチームのKAZYこと新井です。名古屋にある中部支店に所属しています。 Kubernetesのマニフェスト管理方法とクラスタのバージョン更新時の運用方法を変更したため、共有します。

2024-03-27

チーム開発合宿 2024 in 徳島県神山町（技術編）

R&D DevOps Python 自動化連載

こんにちは、研究開発部 Architectグループの辻田です。この記事はチームメンバー合同で作成した記事です。先日、神山ラボへ開発合宿に行ってきました。この記事では合宿中に取り組んだ内容について紹介します。合宿の目的や、全体の様子はチーム開発合宿 …

2024-03-25

チーム開発合宿 2024 in 徳島県神山町（レポート編）

R&D DevOps チームレポート連載

こんにちは、研究開発部 Architectグループの辻田です。今年も神山ラボへ開発合宿に行ってきました！新メンバーも加わり、チームとしては2回目の開発合宿*1です。本記事では合宿レポートを紹介します。合宿で取り組んだ技術的な内容は別記事で出しますので…

2024-03-22

Firehoseを介したS3への中間データ保管と検索性強化

R&D AWS DevOps 連載

はじめにこんにちは、研究開発部 Architectグループの辻田です。 SansanではユーザーフィードバックがSlackのフィードバックチャンネルに集まります。研究開発部ではこれらからモデルやアルゴリズムなどの改善をしています。そのため、より多くのフィード…

2024-01-11

CCSE2023に参加しました

R&D レポート

こんにちは。研究開発部の保坂です。昨年末は久しぶりに年賀状を書いたのですが、最近は年賀状アプリも発達しており、作り始めて30分程度で発送まで手配できたことに感動しました。そのような中、2023年12月22日（金）に、東京大学の伊藤謝恩ホールにて、株…

2023-12-23

【R&D DevOps通信】データ分析基盤の分析用メタデータ管理 -2. 実装-

R&D GCP データ分析連載

こんにちは。研究開発部 Architectグループデータエンジニアの出相(デアイ)です。本記事は Sansan Advent Calendar 2023 の23日目、および【R&D DevOps通信】の連載記事のひとつです。データ分析基盤で分析をする際に必要となる分析用メタデータの管理・…

2023-12-22

Knative ServingをKustomizeでPatchStrategicMergeしたい！

R&D DevOps 連載

こんにちは、技術本部研究開発部 Architect グループ ML Platform チームの宮地です。本記事は Sansan Advent Calendar 2023 の22日目、および【R&D DevOps通信】の連載記事のひとつです。 adventar.org 普段の業務では Circuit という Kubernetes を利用し…

#DevOps #Kubernetes #knati #Kustomize

2023-12-19

Helmを使用せずにKustomizeでAirbyteをKubernetes上に構築する

R&D DevOps 連載

こんにちは、技術本部研究開発部ML Platformチームのジャン(a.k.a jc)です。本記事は Sansan Advent Calendar 2023 の19日目、および【R&D DevOps通信】の連載記事のひとつです。 adventar.org 今年6月にData DirectionチームからML Platformチームに異動し…

2023-12-16

全社横断データ基盤へdbt導入を進めている話

R&D GCP

こんにちは。研究開発部 Architectグループの中村です。本記事は Sansan Advent Calendar 2023 の16日目の記事です。今回は、私達のチームで開発&運用している全社横断データ分析基盤のデータレイヤの再設計、及びdbtの導入を進めているという事例について…

#R&D #GCP #dbt