Sansan Builders Blog

Sansanのものづくりを支えるメンバーの技術やデザイン、プロダクトマネジメントの情報を発信

機械学習

BERTによる日本語固有表現抽出の精度改善 〜BERT-CRFの紹介〜

こんにちは、DSOC R&Dグループ インターンの笛木正雄です。大学院では離散最適化の研究室に所属しています。インターンでは、日々、知らないことだらけで、色々なことを経験させていただき、伸びしろを実感する毎日です。 現在は、SansanやEightのニュース配…

書評:『施策デザインのための機械学習入門』

こんにちは. DSOC 研究開発部の黒木裕鷹です. なんと,思いつきで始めたランニングが続いており,最初の1ヶ月は65kmほど走っていたようです! やはり,ばっちり形から入りかっこいいシューズとウェアを用意したのが効いたようです. フルマラソン目指して…

【ML Tech RPT.】第26回 Crowd Counting (群衆の数え上げ) を学ぶ

DSOC研究員の吉村です。最近は、現代短歌について少し興味を持ち始めて、歌集を読んだりしています。様々な解釈ができるので、思考を色々と巡らすのがとても楽しいです。まだまだ基礎も分かっていないところもあるので、その辺りも知りつつ更にいろいろな角…

【ネットワークの統計解析】第8回 事例紹介「Uber における GNN の活用」

こんにちは. DSOC 研究開発部の黒木裕鷹です. 夏の訪れを感じつつある最近ですが,ランニングをはじめました. 形から入ろうと思い,かっちょいいシューズとウェアを揃えたのですが,なんとか1週間は続いており気分が良いです. まだまだ2, 30分走るだけで…

【ML Tech RPT.】第25回 k-center クラスタリングを学ぶ

DSOC 研究員の吉村です。あまり外出できない日々が続いているので、読書に勤しんでおります。直接業務に関係の無いようなものでも、蓄積しておくことでどこかで役に立つだろうという気持ちで幅広いジャンルの本に手を出しては、本の山が部屋を埋め尽くしてい…

自分のTweetを使ってSentencepieceとMeCabの分かち書きの比較を行う

3行で はじめに Sentencepieceとは subwordとは Sentencepieceでの取り組み SentencepieceとMeCabの比較 利用するデータセット 利用したコード 適当なTweetを分かち書きしてみる Tweet全部を分かち書きし、頻度順に並べてみる まとめ 注釈 3行で Sentencepie…

【ML Tech RPT.】第24回 ソフトラベルを学ぶ

DSOC 研究員の吉村です. 先日スーパーに買い物に行ったところ、玄米が目に飛び込んできました. 早速買って, 玄米を初めて自分で炊きました. それまで, 全く知らなかったのですが, 炊く前にそれなりの時間, 玄米を水につけておく必要があるらしく, 結構面倒だ…

【ネットワークの統計解析】第7回 グラフラプラシアン・グラフフーリエ変換を簡単に振り返る

こんにちは. Sansan DSOC 研究開発部の黒木裕鷹です.また自粛期間が長くなってきましたね. 私も健康を取り戻さねばと思い,マルチビタミンやDHA,食物繊維を積極的に取り入れています.ハイボールに食物繊維を溶かすのが,罪悪感とアルコールが薄まり気分…

「ML勉強会」を開催しました

こんにちは、DSOC 研究員の大垣です。先日5/14(金)に開催した「ML勉強会」のレポートをお届けします。 sansan.connpass.com

【ML Tech RPT.】第23回 Factorization Machines を学ぶ.

DSOC 研究員の吉村です. 最近非常においしいと評判の,とあるジャムを手に入れました. ジャムだけあっても仕方ないので, せっかくなのでトースターも合わせて買ってみました. 焼いたパンに美味しいと評判のジャムが合うのかどうか, 食べるのが待ち遠しいです.…

【ネットワークの統計解析】第6回 論文紹介1「GCNを用いたフェイクニュースの検知」

こんにちは. Sansan DSOC 研究開発部の黒木裕鷹です.先月も,今月も,また服を買ってしまいました. 出かける先はコンビニぐらいしかないのですが,おしゃれをすると心が躍り,陳列商品も不思議とキラキラして見えますね. さて,この連載では,自分の勉強…

「分析コンペ勉強会」を開催しました

こんにちは、Sansan DSOC 研究開発員の齋藤(@sinchir0)です。 3/2(火) 19:00 -21:00にて分析コンペ勉強会を開催させて頂きました。 sansan.connpass.com 今回は本勉強会のレポートを書かせて頂きます!

【ML Tech RPT.】第22回 構造に関連する機械学習を学ぶ(8) ~グラフ その4~ Knowledge Graph

DSOC 研究員の吉村です. 最近はR&Dの他のメンバーが食べていたのに感化されて, BASE FOOD という完全食のパンを毎朝食べています. 特にその中でもメープル味がお気に入りで, 非常に美味しく食べやすいです. さて, 今回は Heterogeneous Graph の一つの表現の…

分析コンペ挑戦記: Cassava編

初めまして、Sansan DSOC 研究開発部の齋藤慎一朗と申します。(Twitterではsinchir0と名乗っています。) 分析コンペに参加するのが趣味なので、挑戦した内容と結果を定期的にブログで投稿していければと思い、執筆させてもらっています。 今回は、Cassava…

【ネットワークの統計解析】第5回 代表的なネットワークのモデルを俯瞰する (3)

こんにちは. Sansan DSOC 研究開発部の黒木裕鷹です. 2回目の緊急事態が宣言され,昇降デスクを買ったりモニターや服を買い足したりしていました. お財布は寂しいですが,在宅戦闘力が高まりなんだか良い気分です. さて,この連載では,自分の勉強・復習…

【ML Tech RPT. 】第21回 構造に関連する機械学習を学ぶ (7) ~グラフ その3~

DSOC研究員の吉村です. あけましておめでとうございます. 今年もブログをたくさん書いていけたらいいなと思います. 今年は 01/04 に初めて餅を焼いて食べました. やはり, 餅を食べると正月を感じられて最高ですね.さて, 今回は GNN (Graph Neural Network) …

Hands-on guidance to DGL library _ (5) Training on large graphs

Hi, I am XING LI, a researcher from Sansan DSOC Data Analysis Group. This is the article of Day 9 of Sansan Advent Calendar 2020. Last time, we talked about some common tasks in deep graph learning and built a toy network on Node Classific…

【ML Tech RPT. 】第20回 構造に関連する機械学習を学ぶ (6) ~グラフ その2~

DSOC研究員の吉村です. 最近はオーザックのバーベキュー味にハマってます. 気づいたら買って食べているので恐ろしい限りです. 今回も引き続き, グラフ構造に関連する機械学習の話をしていきます. まずは, グラフの種類の話から始めて, 次に深層学習に依らな…

【Zoom or Die】第3回 torchvisionのI/O・前処理が新しくなった話

こんにちは,DSOC研究開発部 Automation Groupの内田です. 普段オフィスではスタンディングデスクと曲面ディスプレイという環境で作業をしているのですが,秋は設備投資の季節ということで,一念発起して自宅にも曲面ディスプレイを導入しました.ディスプ…

【Techの道も一歩から】第33回「文献紹介:Beyond Accuracy: Behavioral Testing of NLP Models with CheckList」

こんにちは。 DSOC 研究開発部の高橋寛治です。 社内の論文読み会で紹介した評価に関する文献である「Beyond Accuracy: Behavioral Testing of NLP Models with CheckList」について簡単に所感を交えて*1紹介したいと思います。 なお、本文内での図表は基本…

【ML Tech RPT. 】第19回 構造に関連する機械学習を学ぶ (5) ~グラフ その1~

DSOC研究員の吉村です. 最近はコンビニスイーツにハマってます. この時期 (執筆時点で10月ごろ) になると, 芋, 南瓜, 栗系の物を探しては色々試しています.さて, 前回からしばらく空いてしまいましたが今回は「グラフ」についてです. 近年では GCN や, Graph…

【Zoom or Die】第2回 Hydra+Axでハイパーパラメータサーチ

こんにちは,DSOC 研究開発部の内田です. 最近すっかり秋めいてきて,短パン小僧 の私としてはちょっと寒いくらいです. 涼しくなってきたので1人で寺巡りをすることが多いのですが.そのせいで夏本番より日焼けして短パン小僧感が増す始末です. 先日同研…

【Techの道も一歩から】第32回「MLOps に入門」

こんにちは。DSOC 研究開発部の 高橋寛治です。 突然ですが、みなさん MLOps を実践されていますか。私は雰囲気しか知りません。 今回はそんな MLOps について学んだ概念と一つのツールである DVC について紹介します。 また、今実際に使っている中で感じて…

© Sansan, Inc.