Sansan Builders Box

Sansanのものづくりを支える技術やデザイン、プロダクトマネジメントの情報を発信

DSOC

NLP2020 言語処理学会にて3件の口頭/ポスター発表を行いました

こんにちは、DSOC研究開発部の奥田です。 今回は3/17から3/20にかけてオンラインで開催された言語処理学会第26回年次大会 (NLP2020)に同僚の真鍋と高橋とともに参加しましたので、その報告をしたいと思います。3月初旬のDEIM2020に引き続きオンライン開催と…

Sansan DSOCでのインターンを卒業しました

こんにちは,DSOC 研究開発部 インターン生の内田です. タイトルにありますように,3/30でDSOCでの長期インターンシップを卒業し,4月から新卒として羽ばたきます. 本エントリはそんな私の 「公式退職エントリ」 となります.自分語りにお付き合いいただけ…

Wikipediaを元にした日本語の名寄せデータセットを作成しました

こんにちは、DSOC 研究開発部の奥田です。以前の私のブログ記事ではコーギーの動画を見ていると書きましたが、とうとうコーギーを家族として迎え入れ、現在生後6ヶ月の子犬と暮らしております。 さて私たちDSOCでは、SansanやEightの価値を高めるために様々…

AWS Well-Architected フレームワークを活用したコスト最適化への取り組み

DSOC Infrastructure Group の大澤です。 新型コロナウイルスの影響でマスクが品薄になっていますね。花粉症なので最近は常にマスクしているのでマスクがないと辛いです。幸いにも災害対策で備蓄していたマスクがあったのでそれでなんとかしのいでいます。 …

AWS re:Invent 2019 にいってみた。(2日目)

こんにちは。 DSOC Infrastructure Groupの水谷です。ヘヴィ・トリップ最高でした! メタルを通って来た人で観てない人が居たら是非観ていただきたい最高の映画でした。ベース担当がホントにベース担当な性格だったのが良かったなぁ。メタルついでですが、オ…

遂に念願の「異体字入力」を開始しました

DSOC Data Management Group*1 の三原です。 2020年2月4日、多くのご要望をいただき個人的にも念願であった、Sansanサービスにおける「氏名の異体字入力」がついにリリースされたため、ご紹介させていただきます。Sansanではこれまで、スキャンされた名刺の…

DSOCで行なっているメタデータ管理について

初めまして。DSOC Data Direction Groupの有山と申します。 現在、Data Direction Groupでは私を入れて主に2名のメンバーがデータエンジニアとして職務と向き合っています。 ところで、データエンジニアの仕事とはどういうものを想像するでしょうか。Data Di…

DSOC R&Dにて4名の長期インターン生を受け入れました

こんにちは、DSOC R&Dグループ研究員の奥田です。学会原稿に追われて年末も会社に来て仕事をしていました。Sansanには休日出勤すると別日に休みを振替できる制度があるので、1月後半は少しのんびりしようと思います。 さて、昨年2019年の11月から12月にかけ…

Sansan Labs 開発での Terraform ディレクトリ構成

初めまして。あけましておめでとうございます。 DSOC R&D アーキテクトの鈴木賢志です。 Sansan Labs*1 では、新しい働き方の実現を目指し実験的な機能を一部公開しています。私は普段、それらの開発を中心に、R&D から生まれるサービスの品質改善などに取り…

DSOCでのDatadog活用について

本記事は、Datadog Advent Calender 2019の12/25(水)の記事です。DSOC インフラエンジニアの赤羽です。Datadog Advent Calenderということで、DSOCでのDatadog導入から活用までをお伝えしたいと思います。 Datadogの導入理由 マルチクラウドの監視設定作業…

AWS と GCP のコストを減らせ!(Redash による可視化編)

DSOC Infrastructure Group の 大澤 です。 最近自身のあまりの不健康ぶりにさすがに危機感を抱いたので、自宅から徒歩10分にある24時間営業のフィットネスクラブに申し込んできました。過去何回か挫折しているので今度こそ継続したいものです。 さて、突然…

はじめてのサイレントセッションでの登壇:Sansan Builders Box 2019

サイレントセッションと入力しようと、「さい」まで打鍵すると「再断裂」がサジェストされる、そんな、アキレス腱の再断裂*1におびえながら日々を過ごしているDSOC R&Dグループの高橋寛治です。 えっとぶり*2に人前でしゃべるのですが、なんと Sansan Builde…

新サービス開発でインフラ担当がやったこと //主に運用とセキュリティの話

こんにちは。 DSOC Infrastructure Groupの水谷です。*1 趣味は釣りです。 最近、物忘れが激しく本ブログの初稿日すらほぼ忘れてました。 海馬がちゃんと働いているのか不安でなりません。*2さて、今回はDSOCで新規サービスとして開始されたNews配信システム…

インフラおじさんが、Google Cloud Next ’19 in Tokyo に行ってみた。

こんにちは。 DSOC Infrastructure Groupの水谷です。*1 グループ内の最年長で学生の時にJavaが産声を上げてたくらいのおじさんです。 主な業務は昔話をして皆を困らせることです。*2会場は東京プリンスホテルとプリンスパークタワーで、プリンスパークタワ…

名刺画像からの企業ロゴ抽出技術

こんにちはDSOC R&D の糟谷です。今回は、Sansanで開発した「名刺画像からの企業ロゴマーク抽出技術」について紹介しようと思います。 SansanやEightでは取り込んだ名刺のロゴマークが表示されるようになっています。表示されるロゴは、Webから取得したもの…

企業研究に特化したカンファレンスCCSE2019にDSOCが参加しました

こんにちは、DSOC R&Dグループ研究員の 奥田 です。東大本郷キャンパスに来ると、「ひろ武」という閉店してしまった中華料理屋さんを思い出します。 この記事では、7月13日に開催されたCCSE2019に参加/登壇してきた内容をお届けしたいと思います。今回はSans…

R&D サービスを ECS/Fargate に移行した

DSOC R&D アーキテクトの鷹箸です。 今回は、R&D が提供している一部サービスを EC2 での運用から ECS/Fargate に移行した話をします。 R&D では研究開発したものを Sansan や Eight に WebAPI として提供しており、現状稼働している様々なサービスの基本的…

新サービスで技術的なチャレンジもしていたら「Google Cloud Next '19 in Tokyo」で登壇することになりました

DSOC Development Group の木田です。最近は Ruby on Rails という慣れた世界から外に出て、改めてアーキテクチャや設計というものに向き合っています。自分はどこまで行っても無知で、学ぶことはなくならないのだろうなと実感しています。 さて、そんな中で…

2019年度 人工知能学会全国大会 に参加しました

こんにちは。この春新卒として入社し、DSOC R&D Group に配属された橋本と佐々木です。 先日新潟県新潟市で行われた第33回人工知能学会全国大会 (JSAI2019) に Sansan は3年連続でプラチナスポンサーとして参加いたしました。 本記事では、その模様と Sansan…

2019 年人工知能学会で招待講演とポスター発表を行いました

こんにちは。Sansan DSOC R&D 研究員の真鍋です。 この度、2019 年人工知能学会 (@新潟, 6/4-6/7 ) にて、オーガナイズドセッションの招待講演と、ポスターセッションを行いましたので、簡単ではありますが、ご報告致します。 オーガナイズドセッションは計…

DSOCコーポレートサイトを動かしているインフラ

導入 DSOCインフラチームの藤田です。 皆さんはDSOCのブランドサイトをご覧になったことはありますでしょうか? 自分の所属している部署のブランドサイトがこんなにかっちょいいなんて、テンションアゲアゲです。ちなみにサイトのコンセプトなどはこちらで紹…

「【Sansan×エムスリー】自然言語処理勉強会」を開催しました

こんにちは、DSOC R&Dグループ研究員の奥田です。前回は名古屋でブログを書いてましたが、今回は京都のSansan Innovation Labからお送りしております。 今回は4/24(水)に開催された「【Sansan×エムスリー】自然言語処理勉強会」の様子を紹介したいと思います…

DSOCブース:SIP2019

DSOC Creative Groupの山脇です。3/14.15に開催された「Sansan Innovation Project 2019」にクラウド名刺管理サービス「Sansan」と個人向け名刺アプリ「Eight」を支えるデータ統括部門であるDSOCが展示ブースを出展しました。今年はDSOCが担う大きな二つの役…

名刺データ化コストを改善する

はじめまして、DSOC Development Group で開発をしている石畑です。 現在は名寄せチームで、データ統合の機能開発をしています。関連のある名刺データを統合することで、顧客情報を一元管理できるようにしたり、世の中の様々なビジネスデータを収集し、名刺…

Doc2Vecによる文書ベクトル推論の安定化について

はじめまして,Sansan DSOC R&Dグループ インターンの小林といいます。 2月下旬から3月末までの間,主に自然言語処理 (NLP) に関連した研究開発に挑戦させて頂きました。大学でNLPを専攻している訳では無いですが,他の研究員の方やインターンの先輩とのディ…

単語埋め込みを単語埋め込みに埋め込む -後編-

こんにちは、DSOC R&Dグループ インターン生の荒居です。 この記事は、単語埋め込みに単語埋め込みを埋め込む-前編-の続きの記事です。 前編では、ベースとなる 単語埋め込み になかった単語のベクトル表現を別の単語埋め込みから輸入することを実験的に行い…

単語埋め込みを単語埋め込みに埋め込む -前編-

こんにちは、DSOC R&Dグループ インターン生の荒居と申します。 今年の1月から自然言語処理のインターン生としてお世話になっています。 インターンでは文書分類のタスクを扱っていたのですが、単語埋め込み を用いるようなディープラーニングベースの手法に…

帝国データバンクとSansanの共同研究の可能性ーSIP2019のセッション報告

初めてブログを書くDSOCの研究員の戸田です。社会科学のデータサイエンティストとして、DSOCの研究開発の中でも経済学などの視点から分析をする仕事をしていますが、最近は自然言語処理や機械学習に興味を持ち始め、社内の専門家たちと勉強会をしています。…

Dawn of Innovation :SIP2019登壇レポート

こんにちは!DSOCの西田です。 最近、Cから始まる大好きなブランドと心中すると心に決め、Yから始まるブランドの服をたくさん売りました。今のところ、悔いはありません。 さて、今回はそんな強い信念を持ちながら挑んだイベントSIP2019の登壇レポートをお届…

言語処理学会第25回年次大会に参加し発表しました

こんにちは。 DSOC R&D グループの高橋寛治です。 2019年3月12日から15日にわたり開催された言語処理学会第25回年次大会に参加し、ポスター発表を行いました。 本記事は、参加報告および発表内容の紹介となります。 言語処理学会第25回年次大会 言語処理学会…

© Sansan, Inc.