Sansan Builders Blog

Sansanのものづくりを支えるメンバーの技術やデザイン、プロダクトマネジメントの情報を発信

R&D

Economics Meets Data Science: The Structural Estimation Series Part III

Today's Agenda Hello again. I'm DSOC's Juan. It's time for the part III of the Structural Estimation Series. In the last post I described the dynamic optimization problem of Harold Zurcher according to Rust (1987), and presented some impor…

Hands-on guidance to DGL library _ (1) Introduction and Message Passing

Hi, I am XING LI, a researcher from Sansan DSOC. Graph is a more general data form to describe our world. Sansan DSOC is creatively exploiting graph data to mining new value for benefitting customers. To coin a phrase, sharp tools make goo…

歴史をたどってディープラーニングを学ぶ第六回 M対Nのコンボリューションでカラー画像を扱う

こんにちは、ニューラルネット老人こと糟谷勇児です。今回は色について考えていきます。 色を扱うのは難しい 画像認識といえば色の活用が重要そうですが、実際は一筋縄ではいきません。 私が新入社員だったころのことです。 中国人の先輩が画像検索エンジン…

【Techの道も一歩から】第28回「深層学習による物体検出で遊んでみる」

こんにちは。DSOC 研究開発部の高橋寛治です。 新型コロナウイルス感染症対策では、外出自粛を徹底することが大事とされており、自宅でできる遊びを日々模索中です。 さて、今回は自宅のノートパソコンや物を使って、深層学習による物体検出で遊びます。 物…

▲The Prism of Creativity ▽ vol.8 商品パッケージをつくるシステム [機械学習編]

こんにちは、Sansan DSOC 研究員の西田です。 最近は、外に出れずせっかく購入した春夏物が着れないので、かわりに在宅勤務時には香水をつけて気分を高めています。 次のパリコレは無事に開催されることを祈っています。さて、前回の記事では、Computational…

【ML Tech RPT. 】第16回 構造に関連する機械学習を学ぶ (2) ~系列ラベリング~

DSOC研究員の吉村です. 昨今の情勢により, 外食をすることが難しくなり, 私も自炊をするようにしました. 折角自炊をするのでスキルを高めたいと思い, 最近はオムレツを綺麗に焼く練習ばかりしています. その結果, 一日にかなりの数の卵を食べてしまっている…

【つながりに効く、ネットワーク研究小話】vol.14 もう一つの「社会的距離」

Sansan DSOC研究員の前嶋です。「つながりに効く、ネットワーク研究小話」の第14回です。本来は今頃、夏鳥を観察しに戸隠高原に遠征する予定だったのですが、新型コロナウイルス禍の中で、自宅待機を余儀なくされています。 ソーシャル・ディスタンシング こ…

歴史をたどってディープラーニングを学ぶ 第五回 LeNetは何を学習したのか

こんにちは、ニューラルネット老人こと糟谷勇児です。 最近、黄鉄鉱化したアンモナイトの化石を買ってみました。 化石は地面に埋まった骨や殻が、長い時間をかけて周りの地盤の成分に置換されていき、中身は元の成分ではなく、周りの成分に置き換わっている…

【Techの道も一歩から】第27回「BERTで作ってみた日本語固有表現抽出器の推論部分を書く」

こんにちは。DSOC 研究開発部の高橋寛治です。 今回は、前回の 「BERTで日本語固有表現抽出器を作ってみた」 に続き、作った固有表現抽出器をWebAPI化します。 モデルを把握する transformers ライブラリの 固有表現抽出のサンプル を流用してモデルを作成し…

Economics Meets Data Science: Coding With Style

Hello, Juan here! It’s been a few months since my last post. We have been quite busy at DSOC releasing some sweet stuff for Sansan users, and I’m still working on the next part of the Structural Estimation Series. For now, I want to talk a…

NLP2020 言語処理学会にて3件の口頭/ポスター発表を行いました

こんにちは、DSOC研究開発部の奥田です。 今回は3/17から3/20にかけてオンラインで開催された言語処理学会第26回年次大会 (NLP2020)に同僚の真鍋と高橋とともに参加しましたので、その報告をしたいと思います。3月初旬のDEIM2020に引き続きオンライン開催と…

Sansan DSOCでのインターンを卒業しました

こんにちは,DSOC 研究開発部 インターン生の内田です. タイトルにありますように,3/30でDSOCでの長期インターンシップを卒業し,4月から新卒として羽ばたきます. 本エントリはそんな私の 「公式退職エントリ」 となります.自分語りにお付き合いいただけ…

▲The Prism of Creativity ▽ vol.7 機械と協働してクリエイティブに[機械学習編]

こんにちは!Sansan DSOC 研究員の西田です。最近は密かに髪の色をブルーブラックにしましたが、自然光に当たらないと青くならないため、誰にも気づかれません。烏のような黒髪を目指していきたいと思います。 先日までMedia Ambition Tokyo 2020に出会いの…

【ML Tech RPT. 】第15回 構造に関連する機械学習を学ぶ (1)

DSOC研究員の吉村です. 最近は (ファッション誌ではなく) ファッション史にハマっていて, 色々本をあさっています. 世の中の流れをファッションで変えてきたクリエイターやデザイナーの逸話はとても面白いです.さて, 今回からは構造に関連する機械学習につい…

【Intern CV Report】Trainsによる実験管理

こんにちは,DSOC 研究開発部 インターン生の内田です.先日プチ卒業旅行として伊豆の温泉旅館に行ってきました.伊豆といえば バナナワニ園 ですよね,異論は認めません.バナナワニ園のワニたちは基本的に動かないので思わず「休日の俺じゃん」って呟いて…

【Techの道も一歩から】第26回「BERTで日本語固有表現抽出器を作ってみた」

こんにちは。DSOC 研究開発部の高橋寛治です。 流行りの BERT(Bidirectional Encoder Represenations from Transformers) ですが、論文を読んだあと、マスク部分を当てるというサンプルを動かしその的確さに驚いたところで、手が止まっていました。 今回は、…

オンライン開催となったDEIM2020に協賛企業として参加しました

こんにちは、DSOC 研究開発部の橋本です。前回から引き続きファイアーエムブレムをぼちぼちやっていますが、全ての攻撃を躱すユニットを作ってしまうと良くも悪くも一気に簡単になってしまい、なんだかなあ、となっています。さて、今回は3/2(月) ~ 3/4(水) …

【つながりに効く、ネットワーク研究小話】vol.13 「やぁやぁ、知ってる?」―噂と社会ネットワーク

Sansan DSOC研究員の前嶋です。随分とご無沙汰してしまいました。「つながりに効く、ネットワーク研究小話」の第13回です。先日、新宿御苑に独りで散歩に出かけたのですが、早咲きの桜の木に野鳥が集まっていました。双眼鏡でよく観察してみると、ヒヨドリの…

Wikipediaを元にした日本語の名寄せデータセットを作成しました

こんにちは、DSOC 研究開発部の奥田です。以前の私のブログ記事ではコーギーの動画を見ていると書きましたが、とうとうコーギーを家族として迎え入れ、現在生後6ヶ月の子犬と暮らしております。 さて私たちDSOCでは、SansanやEightの価値を高めるために様々…

歴史をたどってディープラーニングを学ぶ 第四回 LeNetを作ってコンボリューショナルネットを学ぶ

こんにちは、DeepLearning老人こと糟谷勇児です。 会社では老人ですが、地域活動コミュニティでは若者扱いされギャップに驚いています。 そんなわけで今回もDeepLearningを学んでいきたいと思います。 前回はパーセプトロンを多層化することで画像認識の精度…

【ML Tech RPT. 】第0回 本連載を書くことについて

DSOC研究員の吉村です. 私の好きな歌の歌詞の中に、「案外第0話って後から書かれるよね」みたいなことが書いてあります。(具体的に書くと、どの曲なのかがわかるので雰囲気で書いてます。)さて, 本連載もそれなりに回数を重ねてきたので, その歌詞のごとく第…

【Techの道も一歩から】第25回「できる限りわかりやすく規則による前処理・後処理を記述する」

こんにちは。 DSOC R&D グループの高橋寛治です。 テキストに対して何かしらのアルゴリズムにより結果を得た際に、どうしても出力したくない項目や、少し前処理を書けば改善される、といったことがあります。 例えば機械学習の出力を調整するには、パラメー…

NetSci-X2020に参加してきました

こんにちは!DSOCの西田です。少しずつ春めいてきて、春夏物の服を買いに出かけましたが、気づいたら来年の秋冬物を予約しているということがありました。次回はしっかりと春夏物を見にいきたいと思います。さて、本題に移ります!今回は1月20~23日に早稲田…

「画像処理 × 深層学習 勉強会」を開催しました

こんにちは,DSOC R&Dグループ インターン生の内田です. 今回は,1/29(水)に弊社オフィスで開催いたしました「画像処理 × 深層学習 勉強会」 のレポートをお届けしたく思います. 本イベントはSansan DSOCの2名に加え,ZOZO Researchさんから1名ゲストをお…

DSOC R&Dにて4名の長期インターン生を受け入れました

こんにちは、DSOC R&Dグループ研究員の奥田です。学会原稿に追われて年末も会社に来て仕事をしていました。Sansanには休日出勤すると別日に休みを振替できる制度があるので、1月後半は少しのんびりしようと思います。 さて、昨年2019年の11月から12月にかけ…

【ML Tech RPT. 】第14回 機械学習のモデルの評価方法 (Evaluation Metrics) を学ぶ (5)

DSOC研究員の吉村です. 年末年始の連休で本をたくさん読むぞと意気込んだにも関わらず, 2.5冊しか読めなかった悔しさに苛まれております. さて, 今回も前回に引き続き評価指標についてまとめていきます. 特に, ランキング学習の出力結果を評価する際に用いら…

【Techの道も一歩から】第24回「高速かつ省メモリな辞書ライクなライブラリDAWG」

こんにちは。 DSOC R&D グループの高橋寛治です。 Pythonの辞書オブジェクトは取り扱いやすいため、単語とIDの変換テーブルを作ったり、複合語の結合のためにデータ構造を工夫して簡易なトライ木を構築したりと、自分でコーディングすることがあるかと思いま…

Sansan Labs 開発での Terraform ディレクトリ構成

初めまして。あけましておめでとうございます。 DSOC R&D アーキテクトの鈴木賢志です。 Sansan Labs*1 では、新しい働き方の実現を目指し実験的な機能を一部公開しています。私は普段、それらの開発を中心に、R&D から生まれるサービスの品質改善などに取り…

VAEに基づくグラフの表現学習

R&D

こんにちは。年末年始はファイアーエムブレムで可処分時間が消えてしまった DSOC R&D Group の橋本です。 さて、今回の記事では、変分オートエンコーダ (Variational Auto-Encoder, VAE) [1]に基づくグラフの表現学習について紹介したいと思います。 近年グ…

歴史をたどってディープラーニングを学ぶ 第三回 Cifar10と勾配消失問題についての考察

こんにちは、ニューラルネット老人こと糟谷勇児です。 最近は恐竜に凝っていて化石を買ったりしています。ニューラルネット界の化石と化してしまう前に、今回もディープラーニングを勉強していきたいと思います。さて、前回はReLUについて自作のプログラムで…

© Sansan, Inc.