Sansan Builders Box

Sansanのものづくりを支える技術やデザイン、プロダクトマネジメントの情報を発信

R&D

Economics Meets Data Science: Coding With Style

Hello, Juan here! It’s been a few months since my last post. We have been quite busy at DSOC releasing some sweet stuff for Sansan users, and I’m still working on the next part of the Structural Estimation Series. For now, I want to talk a…

NLP2020 言語処理学会にて3件の口頭/ポスター発表を行いました

こんにちは、DSOC研究開発部の奥田です。 今回は3/17から3/20にかけてオンラインで開催された言語処理学会第26回年次大会 (NLP2020)に同僚の真鍋と高橋とともに参加しましたので、その報告をしたいと思います。3月初旬のDEIM2020に引き続きオンライン開催と…

Sansan DSOCでのインターンを卒業しました

こんにちは,DSOC 研究開発部 インターン生の内田です. タイトルにありますように,3/30でDSOCでの長期インターンシップを卒業し,4月から新卒として羽ばたきます. 本エントリはそんな私の 「公式退職エントリ」 となります.自分語りにお付き合いいただけ…

▲The Prism of Creativity ▽ vol.7 機械と協働してクリエイティブに[機械学習編]

こんにちは!Sansan DSOC 研究員の西田です。最近は密かに髪の色をブルーブラックにしましたが、自然光に当たらないと青くならないため、誰にも気づかれません。烏のような黒髪を目指していきたいと思います。 先日までMedia Ambition Tokyo 2020に出会いの…

【ML Tech RPT. 】第15回 構造に関連する機械学習を学ぶ (1)

DSOC研究員の吉村です. 最近は (ファッション誌ではなく) ファッション史にハマっていて, 色々本をあさっています. 世の中の流れをファッションで変えてきたクリエイターやデザイナーの逸話はとても面白いです.さて, 今回からは構造に関連する機械学習につい…

【Intern CV Report】Trainsによる実験管理

こんにちは,DSOC 研究開発部 インターン生の内田です.先日プチ卒業旅行として伊豆の温泉旅館に行ってきました.伊豆といえば バナナワニ園 ですよね,異論は認めません.バナナワニ園のワニたちは基本的に動かないので思わず「休日の俺じゃん」って呟いて…

【Techの道も一歩から】第26回「BERTで日本語固有表現抽出器を作ってみた」

こんにちは。DSOC 研究開発部の高橋寛治です。 流行りの BERT(Bidirectional Encoder Represenations from Transformers) ですが、論文を読んだあと、マスク部分を当てるというサンプルを動かしその的確さに驚いたところで、手が止まっていました。 今回は、…

オンライン開催となったDEIM2020に協賛企業として参加しました

こんにちは、DSOC 研究開発部の橋本です。前回から引き続きファイアーエムブレムをぼちぼちやっていますが、全ての攻撃を躱すユニットを作ってしまうと良くも悪くも一気に簡単になってしまい、なんだかなあ、となっています。さて、今回は3/2(月) ~ 3/4(水) …

【つながりに効く、ネットワーク研究小話】vol.13 「やぁやぁ、知ってる?」―噂と社会ネットワーク

Sansan DSOC研究員の前嶋です。随分とご無沙汰してしまいました。「つながりに効く、ネットワーク研究小話」の第13回です。先日、新宿御苑に独りで散歩に出かけたのですが、早咲きの桜の木に野鳥が集まっていました。双眼鏡でよく観察してみると、ヒヨドリの…

Wikipediaを元にした日本語の名寄せデータセットを作成しました

こんにちは、DSOC 研究開発部の奥田です。以前の私のブログ記事ではコーギーの動画を見ていると書きましたが、とうとうコーギーを家族として迎え入れ、現在生後6ヶ月の子犬と暮らしております。 さて私たちDSOCでは、SansanやEightの価値を高めるために様々…

歴史をたどってディープラーニングを学ぶ 第四回 LeNetを作ってコンボリューショナルネットを学ぶ

こんにちは、DeepLearning老人こと糟谷勇児です。 会社では老人ですが、地域活動コミュニティでは若者扱いされギャップに驚いています。 そんなわけで今回もDeepLearningを学んでいきたいと思います。 前回はパーセプトロンを多層化することで画像認識の精度…

【ML Tech RPT. 】第0回 本連載を書くことについて

DSOC研究員の吉村です. 私の好きな歌の歌詞の中に、「案外第0話って後から書かれるよね」みたいなことが書いてあります。(具体的に書くと、どの曲なのかがわかるので雰囲気で書いてます。)さて, 本連載もそれなりに回数を重ねてきたので, その歌詞のごとく第…

【Techの道も一歩から】第25回「できる限りわかりやすく規則による前処理・後処理を記述する」

こんにちは。 DSOC R&D グループの高橋寛治です。 テキストに対して何かしらのアルゴリズムにより結果を得た際に、どうしても出力したくない項目や、少し前処理を書けば改善される、といったことがあります。 例えば機械学習の出力を調整するには、パラメー…

NetSci-X2020に参加してきました

こんにちは!DSOCの西田です。少しずつ春めいてきて、春夏物の服を買いに出かけましたが、気づいたら来年の秋冬物を予約しているということがありました。次回はしっかりと春夏物を見にいきたいと思います。さて、本題に移ります!今回は1月20~23日に早稲田…

「画像処理 × 深層学習 勉強会」を開催しました

こんにちは,DSOC R&Dグループ インターン生の内田です. 今回は,1/29(水)に弊社オフィスで開催いたしました「画像処理 × 深層学習 勉強会」 のレポートをお届けしたく思います. 本イベントはSansan DSOCの2名に加え,ZOZO Researchさんから1名ゲストをお…

DSOC R&Dにて4名の長期インターン生を受け入れました

こんにちは、DSOC R&Dグループ研究員の奥田です。学会原稿に追われて年末も会社に来て仕事をしていました。Sansanには休日出勤すると別日に休みを振替できる制度があるので、1月後半は少しのんびりしようと思います。 さて、昨年2019年の11月から12月にかけ…

【ML Tech RPT. 】第14回 機械学習のモデルの評価方法 (Evaluation Metrics) を学ぶ (5)

DSOC研究員の吉村です. 年末年始の連休で本をたくさん読むぞと意気込んだにも関わらず, 2.5冊しか読めなかった悔しさに苛まれております. さて, 今回も前回に引き続き評価指標についてまとめていきます. 特に, ランキング学習の出力結果を評価する際に用いら…

【Techの道も一歩から】第24回「高速かつ省メモリな辞書ライクなライブラリDAWG」

こんにちは。 DSOC R&D グループの高橋寛治です。 Pythonの辞書オブジェクトは取り扱いやすいため、単語とIDの変換テーブルを作ったり、複合語の結合のためにデータ構造を工夫して簡易なトライ木を構築したりと、自分でコーディングすることがあるかと思いま…

Sansan Labs 開発での Terraform ディレクトリ構成

初めまして。あけましておめでとうございます。 DSOC R&D アーキテクトの鈴木賢志です。 Sansan Labs*1 では、新しい働き方の実現を目指し実験的な機能を一部公開しています。私は普段、それらの開発を中心に、R&D から生まれるサービスの品質改善などに取り…

VAEに基づくグラフの表現学習

R&D

こんにちは。年末年始はファイアーエムブレムで可処分時間が消えてしまった DSOC R&D Group の橋本です。 さて、今回の記事では、変分オートエンコーダ (Variational Auto-Encoder, VAE) [1]に基づくグラフの表現学習について紹介したいと思います。 近年グ…

歴史をたどってディープラーニングを学ぶ 第三回 Cifar10と勾配消失問題についての考察

こんにちは、ニューラルネット老人こと糟谷勇児です。 最近は恐竜に凝っていて化石を買ったりしています。ニューラルネット界の化石と化してしまう前に、今回もディープラーニングを勉強していきたいと思います。さて、前回はReLUについて自作のプログラムで…

【つながりに効く、ネットワーク研究小話】vol.12 強いつながりの条件

Sansan DSOC研究員の前嶋です。「つながりに効く、ネットワーク研究小話」の第12回です。静電気が怖いので、オフィスでは放電のために靴を履かずに過ごしているのですが、気を抜くとすぐに”””バチッ”””ときます。とても悲しいです。おすすめの対策法があれば…

本当にあった京都のSansan

DSOC R&Dグループの小林幸司です。 Sansanの京都にある開発拠点 Sansan Innovation Lab(以下SIL) で勤務しています。 SIL執務室。もとは台所の土間を板間に改装しています。 SILイベント用スペース。たまに座椅子に座って作業することも SILができて一年が過…

Economics Meets Data Science: ML and Economics Together at Last

Hello again, Internet! It's December now, the season of presents, Christmas carols, parties, catching colds and eating fried chicken. This time I'm taking a break from the Structural Estimation Series. Instead, I'll discuss a topic that I …

【ML Tech RPT. 】第13回 機械学習のモデルの評価方法 (Evaluation Metrics) を学ぶ (4)

DSOC研究員の吉村です. 最近, 自室の乾燥が気になってきたので, 湿度計を購入しました. 今までは, なんとなく調子が悪いから乾燥しているな, と思う程度だったのですが, 実際の湿度が具体的に数値で見れるようになったことで, 事前に対策を打てるようになり,…

【Techの道も一歩から】第23回「pybind11を使ってPythonで利用可能なC++ライブラリを実装する」

こんにちは。 DSOC R&D グループの高橋寛治です。 普段はPython言語によりアルゴリズムの実装を行っています。 スクリプト言語はコンパイルが不要であり、試行錯誤しやすいためです。 しかしながら、実行速度はコンパイル言語に比べて見劣りします。 そこで…

IBIS2019にてSansanから2件のポスター発表を行いました

こんにちは、DSOC R&Dグループ研究員の奥田と吉村です。名古屋駅の新幹線ホームのきしめん屋で、15分後に乗らなければいけない新幹線を控え二人できしめんを急いで食べました。 さて、2019年11月20日から24日にかけて名古屋で開催された第22回情報論的学習理…

書籍購入支援制度'Geek Seek Book'を活用して今年購入した本

こんにちは。 DSOC R&D グループの高橋寛治です。 この記事は Sansan Advent Calendar 2019 - Adventar の初日の記事です。 ゆるい記事にお付き合いいただけると幸いです。 Sansanの社内制度の一つに、書籍・資料の購入支援を行う Geek Seek Book があります…

▲The Prism of Creativity ▽ vol.6 競争とクリエイティビティ[計算社会科学編]

どうも、西田です。 最近ハマっているYouTuberのこばしり。さん風に書き始めてみました。 前回のブログの冒頭にも書いた、某Cから始まるブランドのハーネスを着てとある百貨店の店舗に行くと、入店2秒でハーネスの購入を薦められました。とてもすごいレコメ…

【Intern CV Report】Deep Network Interpolationを試す

こんにちは,DSOC R&Dグループ インターン生の内田です. 最近自宅にスタンディングデスクを導入したのを皮切りに,家具に無限にお金が溶けていっています. 季節と共に財布も寒くなってきています… 皆さんは暖かくしてください… さて,今回は新しいスタンデ…

© Sansan, Inc.