Sansan Tech Blog

Sansanのものづくりを支えるメンバーの技術やデザイン、プロダクトマネジメントの情報を発信

R&D

CCSE2023に参加しました

こんにちは。研究開発部の保坂です。昨年末は久しぶりに年賀状を書いたのですが、最近は年賀状アプリも発達しており、作り始めて30分程度で発送まで手配できたことに感動しました。そのような中、2023年12月22日(金)に、東京大学の伊藤謝恩ホールにて、株…

【R&D DevOps通信】データ分析基盤の分析用メタデータ管理 -2. 実装-

こんにちは。研究開発部 Architectグループ データエンジニアの出相(デアイ)です。 本記事は Sansan Advent Calendar 2023 の23日目、および【R&D DevOps通信】の連載記事のひとつです。 データ分析基盤で分析をする際に必要となる分析用メタデータの管理・…

Knative ServingをKustomizeでPatchStrategicMergeしたい!

こんにちは、技術本部研究開発部 Architect グループ ML Platform チームの宮地です。 本記事は Sansan Advent Calendar 2023 の22日目、および【R&D DevOps通信】の連載記事のひとつです。 adventar.org 普段の業務では Circuit という Kubernetes を利用し…

Helmを使用せずにKustomizeでAirbyteをKubernetes上に構築する

こんにちは、技術本部研究開発部ML Platformチームのジャン(a.k.a jc)です。 本記事は Sansan Advent Calendar 2023 の19日目、および【R&D DevOps通信】の連載記事のひとつです。 adventar.org 今年6月にData DirectionチームからML Platformチームに異動し…

全社横断データ基盤へdbt導入を進めている話

こんにちは。研究開発部 Architectグループの中村です。 本記事は Sansan Advent Calendar 2023 の16日目の記事です。 今回は、私達のチームで開発&運用している全社横断データ分析基盤のデータレイヤの再設計、及びdbtの導入を進めているという事例について…

Vision-Language Modelによる画像品質評価のまとめ

はじめに 研究開発部の今井海人です。普段は画像復元や画像の品質評価といった分野に携わっています。今年はVision-Language Model(VLM)の発展が特筆すべきトレンドだったかと思います。特にGPT-4Vの登場により、画像品質評価におけるアプローチも大きく変…

【GitHub Actions】reviewdog + reusable workflows によるCI/CD共通化

この記事は Sansan Advent Calendar 2023 の13日目の記事です。および【R&D DevOps通信】の連載記事のひとつです。 こんにちは、研究開発部 Architectグループの藤岡です。 今回は部で運用しているCI/CDに関する取り組みについてお話しします。共通化のノウ…

1年間の挑戦と成長:チームビルディングの舞台裏

この記事は Sansan Advent Calendar 2023 の11日目、および【R&D DevOps通信】の連載記事のひとつです。 こんにちは、研究開発部 Architectグループの辻田です。去年の12月頃にランニングを始めて早1年、年間の走行距離は2114kmとなりました。 フルマラソン…

NineOCR の最近と今後

本記事は Sansan Advent Calendar 2023 第9日目の記事です。 adventar.org はじめに こんにちは、研究開発部の内田です。 みなさん師走はどうお過ごしでしょうか。 私は先日Jリーグを見に行きまして、その試合で見事、東京ヴェルディが昇格を決めました。 16…

全社横断データ基盤における部分的セルフサービス化への取り組み

研究開発部 Architect Groupの大澤秀一です。ブログ寄稿は約2年ぶりです。半年ぐらい前からランニングを始めて、先日フルマラソン完走してきました。おかげで足はボロボロです(笑)。 さて、私たちはBigQueryを中心とした、全社横断データ基盤(以下、デー…

Sansan R&D TECH SHOWCASE -ビジネスをドライブするR&Dのウラガワ大公開-を開催しました

こんにちは、研究開発部の西田です。 週末朝9時からのバスケの練習に向かう電車の中でこの記事を執筆しています。先週の金曜日、研究開発部の取り組みを紹介するSansan R&D TECH SHOWCASEを開催しました!その興奮が冷めやらぬうちに、イベントのハイライト…

2023年 研究開発部 新卒技術研修 ~ テストコード編 ~

こんにちは、研究開発部 Data Analysisグループの笛木です。 4/26(水)〜 4/28(金)で研究開発部内の技術研修を行いました。 こちらのブログの続きでテストコードについての研修資料を一部公開します。研修では新卒2年目の私が1年間で部内のコードなどから…

BigQuery上で土日祝日対応したカレンダーテーブルを作成する

こんにちは。 研究開発部Architectグループにてデータエンジニアとしてデータ分析基盤の開発・運用をしている中村です。 今回はBigQuery上で利用可能な祝日対応したカレンダーテーブルを作成する方法についてご紹介いたします。

TerraformによるAirbyteを利用したデータ基盤へのデータ連携とCI/CD

こんにちは!「Sansan Summer Internship 2023」でインターンをしていた野首侑作です(X, Facebook)。R&D Architectグループに1ヶ月強コミットしていました。今回のインターンで使った技術はこれまで全く触ったことがありませんしたが、チームメンバーのサ…

プラットフォームチームを離れ、利用者になり感じたこと

研究開発部 Architectグループ ML PlatformチームのKAZYこと新井です。 名古屋にある中部支店に所属しています。 先日、一時的にML Platformチームを離れて社内向けシステムを、チームが開発・運用するアプリケーション基盤 "Circuit" に構築しました。 基盤…

MIRU2023に参加しました

こんにちは。研究開発部の本田です。2023年7月25日(火)から7月28日(金)にかけて、静岡県浜松市にて画像の認識・理解シンポジウムMIRU2023が開催されました。弊社からは今年、今井・内田・猿田・本田・李の計5名の研究員が現地に赴き、企業展示に加えてポ…

【R&D DevOps通信】DatadogでKubernetesのNamespaceごとに通知先を振り分る

こんにちは、研究開発部 Architectグループ ML Platformチームに所属の宮地です。 23卒の新卒として入社し、少しづつ業務に慣れてきた今日このごろです。 業務内では主に研究開発部のKubernetes基盤であるcircuitと向き合いながら、研究開発部のDevOpsを推進…

2023年度人工知能学会に参加しました

こんにちは、研究開発部の齋藤慎一朗です。 熊本で行われた2023年度 人工知能学会全国大会 (第37回)において、企業ブースの出展、インダストリアルセッションの発表を行いました。 本ブログでは、その様子について紹介させて頂きます。

2023年 研究開発部 新卒技術研修 ~ 実践編 ~

こんにちは、研究開発部 Architectグループの藤岡です。 4/26(水)〜 4/28(金)で研究開発部内の技術研修を行ったので、その内容を公開します。

【R&D DevOps通信】初めてのEKS Kubernetesバージョン更新を振り返る

研究開発部 Architectグループ ML PlatformチームのKAZYこと新井です。 名古屋にある中部支店に所属しています。 先日、研究開発部内のEKSクラスタのKubernetesのバージョン更新とその振り返りを行いました。 バージョン更新で起きた出来事と思い出を記しま…

「Sansan R&D TECH SHOWCASE 2023」を開催します <その2 画像処理技術編>

こんにちは、研究開発部の糟谷勇児です。 前回に引き続き、研究開発成果やそのプロセスについて発表するイベント「Sansan R&D TECH SHOWCASE2023」の紹介をさせてください。研究開発については、その「テーマ」も気になると思いますが、どうやってテーマを見…

「Sansan R&D TECH SHOWCASE 2023」を開催します <その1 自然言語処理と最適化技術編>

こんにちは、研究開発部の糟谷勇児です。研究開発部では研究開発成果やそのプロセスについて発表するイベント「Sansan R&D TECH SHOWCASE 2023」を開催いたします。 開催:2023年 6月2日(金)15:00〜20:00 場所:Sansan株式会社 表参道本社 イベントページ:h…

【R&D DevOps通信】チーム開発合宿 in 徳島県神山町

技術本部 研究開発部 Architectグループでチームリーダーをやっている鷹箸です。 3/29(水)〜3/31(金)に開発合宿へ行ってきました! チームとしては初めての開発合宿になります。なお、本記事は【R&D DevOps通信】という連載記事のひとつです。

【R&D DevOps通信】Slack BoltとCloud Functionsでデータ基盤アクセス承認システムを開発

こんにちは。研究開発部 Architectグループにてデータエンジニアとしてデータ基盤の開発・運用を担当しているジャン(a.k.a jc)です。 直近の記事にてGoogleグループとIAMによるデータ基盤のアクセス制御方法を紹介しました。 buildersbox.corp-sansan.com 本…

【R&D DevOps通信】研究開発部の.NET基盤をご紹介

技術本部 研究開発部 Architectグループの島です。本連載を最初2回*1*2だけ書いてとんずらしていましたが復活です。 今回は、研究開発部にて .NET 技術がどのように使われているか・何に取り組んできたかをご紹介したいと思います。 当社にはSansanなど.NET…

EKSのクラスタに追加のセキュリティーグループを導入してクラスタバージョン更新に備える

研究開発部 Architectグループ ML PlatformチームのKAZYこと新井です。 名古屋にある中部支店に所属しています。 バージョン更新の負荷を減らすためにEKSにセキュリティーグループを追加した話を紹介します。 なお、本記事は【R&D DevOps通信】という連載記…

NLP2023に参加・発表しました

言語処理学会年次大会(NLP)とは テーマセッション「金融・経済ドメインのための言語処理」 研究発表 聴講内容 D9-2 連続時間フラクショナル・トピックモデル D10-5 監査上の主要な検討事項 (KAM) の前例踏襲の程度に関する業種別及び監査法人別の傾向分析 …

【22新卒 1年間の振り返り】第2回 畑違いの研究分野から研究開発組織に入っての1年を振り返ってみた

はじめに こんにちは、技術本部 研究開発部 Data Analysisグループの金子です。ここ半年毎日コールドシャワーを浴びています。最近は覚悟を決めずとも浴びれるようになり、春を感じる今日この頃です。私がSansanに新卒入社してから一年が経ちました。本記事…

Argo Rolloutsでプログレッシブデリバリを実現する

こんにちは、研究開発部 Architectグループの辻田です。今回はKubernetesアプリケーション基盤にArgo Rolloutsを導入し、カナリアリリースからメトリクスの自動解析、ロールバックの自動化を実現したので紹介していきたいと思います。

自社OCRエンジン「NineOCR」の学習効率化のため SageMaker Training を導入した話

はじめに NineOCR とは NineOCR が抱える課題 Amazon SageMaker Training とは SageMaker Training の始め方 事前準備 AWS が提供しているコンテナイメージを拡張する方法 独自のコンテナイメージに SageMaker Training Toolkit をインストールする方法 スク…

© Sansan, Inc.