Sansan Builders Blog

Sansanのものづくりを支えるメンバーの技術やデザイン、プロダクトマネジメントの情報を発信

R&D

【つながりに効く、ネットワーク研究小話】vol.13 「やぁやぁ、知ってる?」―噂と社会ネットワーク

Sansan DSOC研究員の前嶋です。随分とご無沙汰してしまいました。「つながりに効く、ネットワーク研究小話」の第13回です。先日、新宿御苑に独りで散歩に出かけたのですが、早咲きの桜の木に野鳥が集まっていました。双眼鏡でよく観察してみると、ヒヨドリの…

Wikipediaを元にした日本語の名寄せデータセットを作成しました

こんにちは、DSOC 研究開発部の奥田です。以前の私のブログ記事ではコーギーの動画を見ていると書きましたが、とうとうコーギーを家族として迎え入れ、現在生後6ヶ月の子犬と暮らしております。 さて私たちDSOCでは、SansanやEightの価値を高めるために様々…

歴史をたどってディープラーニングを学ぶ 第四回 LeNetを作ってコンボリューショナルネットを学ぶ

こんにちは、DeepLearning老人こと糟谷勇児です。 会社では老人ですが、地域活動コミュニティでは若者扱いされギャップに驚いています。 そんなわけで今回もDeepLearningを学んでいきたいと思います。 前回はパーセプトロンを多層化することで画像認識の精度…

【ML Tech RPT. 】第0回 本連載を書くことについて

DSOC研究員の吉村です. 私の好きな歌の歌詞の中に、「案外第0話って後から書かれるよね」みたいなことが書いてあります。(具体的に書くと、どの曲なのかがわかるので雰囲気で書いてます。)さて, 本連載もそれなりに回数を重ねてきたので, その歌詞のごとく第…

【Techの道も一歩から】第25回「できる限りわかりやすく規則による前処理・後処理を記述する」

こんにちは。 DSOC R&D グループの高橋寛治です。 テキストに対して何かしらのアルゴリズムにより結果を得た際に、どうしても出力したくない項目や、少し前処理を書けば改善される、といったことがあります。 例えば機械学習の出力を調整するには、パラメー…

NetSci-X2020に参加してきました

こんにちは!DSOCの西田です。少しずつ春めいてきて、春夏物の服を買いに出かけましたが、気づいたら来年の秋冬物を予約しているということがありました。次回はしっかりと春夏物を見にいきたいと思います。さて、本題に移ります!今回は1月20~23日に早稲田…

「画像処理 × 深層学習 勉強会」を開催しました

こんにちは,DSOC R&Dグループ インターン生の内田です. 今回は,1/29(水)に弊社オフィスで開催いたしました「画像処理 × 深層学習 勉強会」 のレポートをお届けしたく思います. 本イベントはSansan DSOCの2名に加え,ZOZO Researchさんから1名ゲストをお…

DSOC R&Dにて4名の長期インターン生を受け入れました

こんにちは、DSOC R&Dグループ研究員の奥田です。学会原稿に追われて年末も会社に来て仕事をしていました。Sansanには休日出勤すると別日に休みを振替できる制度があるので、1月後半は少しのんびりしようと思います。 さて、昨年2019年の11月から12月にかけ…

【ML Tech RPT. 】第14回 機械学習のモデルの評価方法 (Evaluation Metrics) を学ぶ (5)

DSOC研究員の吉村です. 年末年始の連休で本をたくさん読むぞと意気込んだにも関わらず, 2.5冊しか読めなかった悔しさに苛まれております. さて, 今回も前回に引き続き評価指標についてまとめていきます. 特に, ランキング学習の出力結果を評価する際に用いら…

【Techの道も一歩から】第24回「高速かつ省メモリな辞書ライクなライブラリDAWG」

こんにちは。 DSOC R&D グループの高橋寛治です。 Pythonの辞書オブジェクトは取り扱いやすいため、単語とIDの変換テーブルを作ったり、複合語の結合のためにデータ構造を工夫して簡易なトライ木を構築したりと、自分でコーディングすることがあるかと思いま…

Sansan Labs 開発での Terraform ディレクトリ構成

初めまして。あけましておめでとうございます。 DSOC R&D アーキテクトの鈴木賢志です。 Sansan Labs*1 では、新しい働き方の実現を目指し実験的な機能を一部公開しています。私は普段、それらの開発を中心に、R&D から生まれるサービスの品質改善などに取り…

VAEに基づくグラフの表現学習

R&D

こんにちは。年末年始はファイアーエムブレムで可処分時間が消えてしまった DSOC R&D Group の橋本です。 さて、今回の記事では、変分オートエンコーダ (Variational Auto-Encoder, VAE) [1]に基づくグラフの表現学習について紹介したいと思います。 近年グ…

歴史をたどってディープラーニングを学ぶ 第三回 Cifar10と勾配消失問題についての考察

こんにちは、ニューラルネット老人こと糟谷勇児です。 最近は恐竜に凝っていて化石を買ったりしています。ニューラルネット界の化石と化してしまう前に、今回もディープラーニングを勉強していきたいと思います。さて、前回はReLUについて自作のプログラムで…

【つながりに効く、ネットワーク研究小話】vol.12 強いつながりの条件

Sansan DSOC研究員の前嶋です。「つながりに効く、ネットワーク研究小話」の第12回です。静電気が怖いので、オフィスでは放電のために靴を履かずに過ごしているのですが、気を抜くとすぐに”””バチッ”””ときます。とても悲しいです。おすすめの対策法があれば…

本当にあった京都のSansan

DSOC R&Dグループの小林幸司です。 Sansanの京都にある開発拠点 Sansan Innovation Lab(以下SIL) で勤務しています。 SIL執務室。もとは台所の土間を板間に改装しています。 SILイベント用スペース。たまに座椅子に座って作業することも SILができて一年が過…

Economics Meets Data Science: ML and Economics Together at Last

Hello again, Internet! It's December now, the season of presents, Christmas carols, parties, catching colds and eating fried chicken. This time I'm taking a break from the Structural Estimation Series. Instead, I'll discuss a topic that I …

【ML Tech RPT. 】第13回 機械学習のモデルの評価方法 (Evaluation Metrics) を学ぶ (4)

DSOC研究員の吉村です. 最近, 自室の乾燥が気になってきたので, 湿度計を購入しました. 今までは, なんとなく調子が悪いから乾燥しているな, と思う程度だったのですが, 実際の湿度が具体的に数値で見れるようになったことで, 事前に対策を打てるようになり,…

【Techの道も一歩から】第23回「pybind11を使ってPythonで利用可能なC++ライブラリを実装する」

こんにちは。 DSOC R&D グループの高橋寛治です。 普段はPython言語によりアルゴリズムの実装を行っています。 スクリプト言語はコンパイルが不要であり、試行錯誤しやすいためです。 しかしながら、実行速度はコンパイル言語に比べて見劣りします。 そこで…

IBIS2019にてSansanから2件のポスター発表を行いました

こんにちは、DSOC R&Dグループ研究員の奥田と吉村です。名古屋駅の新幹線ホームのきしめん屋で、15分後に乗らなければいけない新幹線を控え二人できしめんを急いで食べました。 さて、2019年11月20日から24日にかけて名古屋で開催された第22回情報論的学習理…

書籍購入支援制度'Geek Seek Book'を活用して今年購入した本

こんにちは。 DSOC R&D グループの高橋寛治です。 この記事は Sansan Advent Calendar 2019 - Adventar の初日の記事です。 ゆるい記事にお付き合いいただけると幸いです。 Sansanの社内制度の一つに、書籍・資料の購入支援を行う Geek Seek Book があります…

▲The Prism of Creativity ▽ vol.6 競争とクリエイティビティ[計算社会科学編]

どうも、西田です。 最近ハマっているYouTuberのこばしり。さん風に書き始めてみました。 前回のブログの冒頭にも書いた、某Cから始まるブランドのハーネスを着てとある百貨店の店舗に行くと、入店2秒でハーネスの購入を薦められました。とてもすごいレコメ…

【Intern CV Report】Deep Network Interpolationを試す

こんにちは,DSOC R&Dグループ インターン生の内田です. 最近自宅にスタンディングデスクを導入したのを皮切りに,家具に無限にお金が溶けていっています. 季節と共に財布も寒くなってきています… 皆さんは暖かくしてください… さて,今回は新しいスタンデ…

【ML Tech RPT. 】第12回 機械学習のモデルの評価方法 (Evaluation Metrics) を学ぶ (3)

R&D

DSOC研究員の吉村です. 先日, Sansan の Scan for Trees という取り組みの一環で, 宮城県の大崎市に植樹に行ってきました. 普段のオフィスでのデスクワークから離れて, 鍬を手に持ち植樹をするという経験は非常に新鮮でした.さて, 今回も引き続き「機械学習…

歴史をたどってディープラーニングを学ぶ 第二回 AlexNetとReLU

こんにちは、ディープラーニング老人こと糟谷です。 前回は2006年の技術を追実験しましたが、まだ13年の隔たりがあります。今日も隔たりを埋めていきたいと思います。 長らく冬の時代が続いていたニューラルネットワークであるが、2006年にジェフリー・ヒン…

Economics Meets Data Science: The Structural Estimation Series, Part II

Hola again! DSOC's Juan here! It's autumn now, time to start craving pumpkin tarts and hot drinks. Recently I'm having hot matcha latte very often, maybe because it reminds me when I was a graduate student cleaning my data in some cafe aro…

はじめてのサイレントセッションでの登壇:Sansan Builders Box 2019

サイレントセッションと入力しようと、「さい」まで打鍵すると「再断裂」がサジェストされる、そんな、アキレス腱の再断裂*1におびえながら日々を過ごしているDSOC R&Dグループの高橋寛治です。 えっとぶり*2に人前でしゃべるのですが、なんと Sansan Builde…

B2B 企業ブランドとは何か vol.2

こんにちは。R&D の真鍋です。B2B ブランディングについての連載第2回です。 buildersbox.corp-sansan.com 前回に引き続き、以下のレビュー論文を読み、要約しながら、B2B ブランドについて、考えていきたいと思います。素人の駄文ですが、ご笑覧ください。 …

【ML Tech RPT. 】第11回 機械学習のモデルの評価方法 (Evaluation Metrics) を学ぶ (2)

DSOC研究員の吉村です. 弊社には「よいこ」という社内の部活のような社内制度があり, 私はその中のテニス部に所属しています. 月一程度で活動をしているのですが, 最近は新たに入社された部員も増えてきて新しい風を感じています.さて, 今回も前回に引き続き…

【Techの道も一歩から】第22回「AWS SageMakerで任意のコンテナをデプロイする」

こんにちは。 DSOC R&D グループの高橋寛治です。 最近は、R&DのD側に興味が寄っており、本連載では pytest や WebAPI化といった話が多くなってきました。 さて、つい先日に Amazon Web Services(AWS) が提供するマネージド型の機械学習サービスの一部機能を…

【ML Tech RPT. 】第10回 機械学習のモデルの評価方法 (Evaluation Metrics) を学ぶ (1)

DSOC研究員の吉村です. 先日, 会社の同僚らと御岳山に登山へ行きました. 私は普段から登山に行く趣味があるわけではないので, 不安を抱えつつ山に向かったのですが, 案外何事もなく無事に帰ってこれました. (山への移動の電車の中で, 話し込みすぎて降りる駅…

© Sansan, Inc.