Sansan Tech Blog

Sansanのものづくりを支えるメンバーの技術やデザイン、プロダクトマネジメントの情報を発信

【ML, Tech, RPT., 】 の検索結果:

【ML Tech RPT.】第26回 Crowd Counting (群衆の数え上げ) を学ぶ

DSOC研究員の吉村です。最近は、現代短歌について少し興味を持ち始めて、歌集を読んだりしています。様々な解釈ができるので、思考を色々と巡らすのがとても楽しいです。まだまだ基礎も分かっていないところもあるので、その辺りも知りつつ更にいろいろな角度で鑑賞できるようになりたいと思っています。 さて、今回は Crowd Counting についての話題を取り上げます。Crowd Counting は、画像上に含まれる対象物 (主に人) を機械で数え上げる問題設定です。ここで言う Cr…

【ML Tech RPT.】第25回 k-center クラスタリングを学ぶ

DSOC 研究員の吉村です。あまり外出できない日々が続いているので、読書に勤しんでおります。直接業務に関係の無いようなものでも、蓄積しておくことでどこかで役に立つだろうという気持ちで幅広いジャンルの本に手を出しては、本の山が部屋を埋め尽くしています。 さて、今回は k-center クラスタリングについて見ていきます。普段は教師なし学習のことを調べることがあまりなかったので、個人的には新鮮でした。それでは本題に入っていきましょう!

【ML Tech RPT.】第24回 ソフトラベルを学ぶ

DSOC 研究員の吉村です. 先日スーパーに買い物に行ったところ、玄米が目に飛び込んできました. 早速買って, 玄米を初めて自分で炊きました. それまで, 全く知らなかったのですが, 炊く前にそれなりの時間, 玄米を水につけておく必要があるらしく, 結構面倒だなということがわかりました. さて, 今回はソフトラベル (Soft Label) にスポットライトを当てます. 最初にソフトラベルの紹介をして, ソフトラベルを利用したいくつかの研究を紹介していきます.

【ML Tech RPT.】第23回 Factorization Machines を学ぶ.

…てみてください! ▼【ML Tech RPT. 】シリーズ buildersbox.corp-sansan.com *1:S. Rendle, "Factorization Machines," ICDM, in 2010. *2:X. Wang, X. He, L. Nie and T. S. Chua, "Item Silk Road: Recommending Items from Information Domains to Social Users," SIGIR,…

【ML Tech RPT.】第22回 構造に関連する機械学習を学ぶ(8) ~グラフ その4~ Knowledge Graph

…き合いください! ▼【ML Tech RPT. 】シリーズ buildersbox.corp-sansan.com *1:S. Ji, S. Pan, E. Cambria, P. Marttinen, P. S. Yu, "A Survey on Knowledge Graphs: Representation, Acquisition and Applications," arXiv, in 2020. *2:A. Bordes, N. Usunier, and A. G…

【ML Tech RPT. 】第21回 構造に関連する機械学習を学ぶ (7) ~グラフ その3~

…ご期待ください. ▼【ML Tech RPT. 】シリーズ buildersbox.corp-sansan.com *1:F. Scarselli, AC. Tsoi, and M. Hagenbuchner, "The graph neural network model," in TNNLS, 2019. *2:TN. Kipf, and M. Welling, "Semi-Supervised Classification with Graph Convolutiona…

Sansanにまつわる「ある数式」について

1. 導入 こんにちは。Sansan株式会社 DSOC 研究開発部の大垣です。 普段はプロダクトを成長させるべくデータサイエンスや機械学習に関わる研究開発をしています。個人的には数学が好きなので(ある程度)高度な数学が有用になる研究開発のテーマを日々探しています。突然ですが、これらのグッズを見たことはあるでしょうか?これらは弊社が作るノベルティなのですが、一見ノベルティとは思えないTシャツがあると思います。そうです、このナゾの数式が入ったTシャツです。

【ML Tech RPT. 】第20回 構造に関連する機械学習を学ぶ (6) ~グラフ その2~

…き合いください! ▼【ML Tech RPT. 】シリーズ buildersbox.corp-sansan.com *1:D. Liben-Nowell, and J. Kleinberg, "The link-prediction problem for social networks," JASIST, in 2007. *2:L. A. Adamic, and E. Adar, "Friends and neighbors on the web," Social net…

【ML Tech RPT. 】第19回 構造に関連する機械学習を学ぶ (5) ~グラフ その1~

…に扱えるパッケージ, そして, どんな分野で研究がなされているかなどを見ていきました. 今自らが直面している課題が何なのか, 何を解決したいのかがわかればより適切な分野の上の研究をサーベイすることができるようになりますし, 適切なツールが使えると思います. 今回は機械学習要素が少なかったので, 次回は満を持して機械学習におけるグラフの扱いについてみていきます. 次回もお楽しみに! ▼【ML Tech RPT. 】シリーズ buildersbox.corp-sansan.com

【ML Tech RPT. 】第18回 構造に関連する機械学習を学ぶ (4) ~格子構造~

…くお願いします。 ▼【ML Tech RPT. 】シリーズ buildersbox.corp-sansan.com *1:O. Ronneberger, P. Fischer, and T. Brox, "U-Net: Convolutional Networks for Biomedical Image Segmentation," in 2015, MICCAI. *2:C. Rother, V. Kolmogorov, and A. Blake, "“GrabCut” …

【ML Tech RPT. 】第17回 構造に関連する機械学習を学ぶ (3) ~時系列予測~

…くお願いします. ▼【ML Tech RPT. 】シリーズ buildersbox.corp-sansan.com *1:沖本竜義, "経済・ファイナンスデータの計量次系列分析", in 朝倉書店, 2010. *2:R. J. Hyndman and G. Athanasopoulos, "Forecasting: Principles and Practice," in Otexts, 2013. *3:F. M. Tseng, and G. H. Tzeng, "A f…

【ML Tech RPT. 】第16回 構造に関連する機械学習を学ぶ (2) ~系列ラベリング~

…いくださいませ. ▼【ML Tech RPT. 】シリーズ buildersbox.corp-sansan.com *1:黒橋禎夫, "改訂版 自然言語処理," 放送大学教育振興会, 2019. *2:M. Schuster and K. K. Paliwal, "Bidirectional Recurrent Newral Networks," in TSP, 1997. *3:Z. Huang, W. Xu, and, K. Yu, "Bidirectional LSTM…

【ML Tech RPT. 】第15回 構造に関連する機械学習を学ぶ (1)

…とお願いします. ▼【ML Tech RPT. 】シリーズ buildersbox.corp-sansan.com *1:D. Tuia, J. Munoz-Mari, M. Kanevski, and G. Camps-Valls, "Structured output SVM for remote sensing image classification," in SPS, 2011. *2:A. Rudi, C. Ciliberto, G. Marconi, and L…

【ML Tech RPT. 】第0回 本連載を書くことについて

…的に書いている価値は得られています. まとめ 今回は一切の技術的な内容を排除して, なぜ連載をやっているのかや, 書くまえに注意していることや重要視していることについて書きました. この連載を書いている人間が, どう言うことを考えて書いているのかを汲み取ってもらった上で, 価値ある連載だと思って読んでくださると嬉しいです. 次回は, MLに関する技術の話を今まで通りする予定です. ▼【ML Tech RPT. 】シリーズ buildersbox.corp-sansan.com

【ML Tech RPT. 】第14回 機械学習のモデルの評価方法 (Evaluation Metrics) を学ぶ (5)

…方法についての記事 【ML Tech RPT. 】第10回 機械学習のモデルの評価方法 (Evaluation Metrics) を学ぶ (1) - Sansan Builders Box 【ML Tech RPT. 】第11回 機械学習のモデルの評価方法 (Evaluation Metrics) を学ぶ (2) - Sansan Builders Box 【ML Tech RPT. 】第12回 機械学習のモデルの評価方法 (Evaluation Metrics) を学ぶ (…

【ML Tech RPT. 】第13回 機械学習のモデルの評価方法 (Evaluation Metrics) を学ぶ (4)

DSOC研究員の吉村です. 最近, 自室の乾燥が気になってきたので, 湿度計を購入しました. 今までは, なんとなく調子が悪いから乾燥しているな, と思う程度だったのですが, 実際の湿度が具体的に数値で見れるようになったことで, 事前に対策を打てるようになり, QOLが少し上がりました.さて, 今回も機械学習のモデルの評価方法についてまとめていこうと思います. いよいよ今回からは少し特殊な問題設定における評価指標について見ていきます. 今回は主にマルチラベル分類 (multi…

【ML Tech RPT. 】第12回 機械学習のモデルの評価方法 (Evaluation Metrics) を学ぶ (3)

R&D

DSOC研究員の吉村です. 先日, Sansan の Scan for Trees という取り組みの一環で, 宮城県の大崎市に植樹に行ってきました. 普段のオフィスでのデスクワークから離れて, 鍬を手に持ち植樹をするという経験は非常に新鮮でした.さて, 今回も引き続き「機械学習のモデルの評価方法」について見ていきます. 前回お伝えした通り, 多クラス分類 (multi-class classification) と回帰 (regression) の評価指標について確認していき…

【ML Tech RPT. 】第11回 機械学習のモデルの評価方法 (Evaluation Metrics) を学ぶ (2)

DSOC研究員の吉村です. 弊社には「よいこ」という社内の部活のような社内制度があり, 私はその中のテニス部に所属しています. 月一程度で活動をしているのですが, 最近は新たに入社された部員も増えてきて新しい風を感じています.さて, 今回も前回に引き続き「機械学習のモデルの評価方法 (Evaluation Metrics)」に焦点を当てていきます. (今回も前回同様, "モデル" という言葉を機械学習のモデルという意味で用います.) 前回は, モデルを評価する観点や注意事項に…

【ML Tech RPT. 】第10回 機械学習のモデルの評価方法 (Evaluation Metrics) を学ぶ (1)

DSOC研究員の吉村です. 先日, 会社の同僚らと御岳山に登山へ行きました. 私は普段から登山に行く趣味があるわけではないので, 不安を抱えつつ山に向かったのですが, 案外何事もなく無事に帰ってこれました. (山への移動の電車の中で, 話し込みすぎて降りる駅とは別の駅まで来てしまうというプチアクシデントはありました.)さて, 今回からは「機械学習のモデルの評価方法を学ぶ」というタイトルで記事を書いていこうかと思います. 以後, 本記事ではモデルという言葉を機械学習のモデルとい…

【ML Tech RPT. 】第9回 敵対的摂動 (Adversarial Perturbation) に対するモデルの頑健性の測り方を学ぶ (3)

DSOC研究員の吉村です. 先日, iPhoneXRに機種変更をしました. 合わせてバーコード決済やSuicaを使えるようにしたのですが, 支払いするのも電車に乗るのもスマホだけで完結できるというのは非常に便利ですね.さて, 今回も前回に引き続き敵対的摂動に対するモデルの頑健性の測り方についての話です. 前回は MLP (Multi Layer Perceptron) や CNN (Convolutional Neural Network) に対する頑健性の評価手法として知ら…

【ML Tech RPT. 】第8回 敵対的摂動 (Adversarial Perturbation) に対するモデルの頑健性の測り方を学ぶ (2)

DSOC研究員の吉村です. 最近は健康第一ということで, 食事の面から健康に気を使い始めました. このことをチームのメンバーに話したところ, シリコンスチーマーを使うと手軽に茹でた野菜が食べれるということを教えてもらえたので, 早速購入しました. さて, 本記事は前回に引き続き「敵対的摂動 (Adversarial Perturbation) に対するモデルの頑健性の測り方」についての話です. 今回は, 前回の記事の最後で書いた適用範囲の広い測定手法について紹介します. 本記…

【ML Tech RPT. 】第7回 敵対的摂動 (Adversarial Perturbation) に対するモデルの頑健性の測り方を学ぶ (1)

DSOC研究員の吉村です。最近は早起きが習慣になってきたので、毎日優雅な朝を迎えることができています。朝早く起きたからと言って、特に何かするわけではないですが時間にゆとりがあるというのはいいことですね。さて、今回からは「敵対的摂動 (Adversarial Perturbation) に対するモデルの頑健性の測り方」に焦点を当てて解説をしていこうと思います。本記事では、このテーマがどのような研究テーマなのかから始まり、おそらく一番初めに提案されたであろう測り方 (評価方法) …

【ML Tech RPT. 】第6回 不均衡データ学習 (Learning from Imbalanced Data) を学ぶ (3)

DSOC 研究員の吉村です。最近はシーバスフィッシングにハマっています。長らく釣れない日々を送っていたのですが、つい最近久しぶりに釣り上げてから、調子がややよくなってきました。さて、前置きはこのくらいにして、今回も不均衡データ学習の話です。今回は、不均衡データに対して異常検知手法を用いる方法について説明をします。ちなみに前回、前々回の記事をまだ読まれていない方はそちらから見ていただけると嬉しいです。 buildersbox.corp-sansan.com buildersbo…

【ML Tech RPT. 】第5回 不均衡データ学習 (Learning from Imbalanced Data) を学ぶ (2)

Sansan DSOC 研究員の吉村です. 気づけば入社から一年が経ち, 社会人二年目に突入しました. 今年もコツコツとブログを継続していこうと思っております. さて, 本題に入っていきましょう. 今回は不均衡データ学習のアプローチの一つである Cost-Sensitive Learning についての話をします. 本記事は前回の記事の続編という立ち位置なので, 前回の記事をご覧になっていない方は, 是非下記の記事から読んでみてください. buildersbox.corp-s…

【ML Tech RPT. 】第4回 不均衡データ学習 (Learning from Imbalanced Data) を学ぶ(1)

Sansan DSOC 研究員の吉村です。最近は憩いの場を求めて、休日に都内の図書館をまわるのが趣味になっています。先輩にこの話をしたところ、国会図書館をオススメされたので、近々行ってみようと思っている今日この頃です。さて、今回は実データを分析する時に頻繁に出現し、予測が難しい 不均衡データ学習 (Learning from Imbalanced Data) 問題について調べました。下記では、不均衡データ学習の概要とその対処法についてまとめました。 不均衡データ (Imbal…

【ML Tech RPT. 】第3回 Zero Shot Learning を学ぶ (3)

Sansan DSOC研究員の吉村です。年が明け2019年になり、あと数ヶ月で次の新卒の皆さんが入ってくることを考えて戦々恐々としています。入社してからこれまででしっかりと力がついているのかなど、思いを巡らす対象は多々ありますが、今まで通り日々コツコツと業務や自己研鑽に励んで行こうと思います。今回も Zero Shot Learning (ZSL) についての記事です。前回は ZSL で用いられる手法として基本的なアプローチに則って考案された SOC、 DeVISE、そして、…

【ML Tech RPT. 】第2回 Zero Shot Learning を学ぶ (2)

Sansan DSOC研究員の吉村です。前回からMachine Learning技術についての連載をはじめました。今回から、弊社のデザイナーに連載用のヘッダ画像を作っていただき、以前にも増してやる気が出ています。 本記事では前回に引き続きZero Shot Learning (ZSL) を紹介します。今回はZSLで利用される手法についていくつかをピックアップして説明していきます。問題設定やZSLを利用するモチベーションなどについては、下記の第1回の記事で説明したので、先に読ん…

【ML Tech RPT. 】第1回 Zero Shot Learning を学ぶ (1)

こんにちは、 Sansan DSOC 研究員の吉村です。今年の春新卒として入社しました。専門は機械学習及びクラウドソーシング周りで、現在は予測モデルの作成やワーカのミスの分析などを行なっています。こちらの連載では、自身の勉強を兼ねて普段の業務やその周辺技術についての発信をしていこうと思います。 初回は、業務とはあまり関係がないところではありますが、知見を溜めるという意味合いも込めて以前から興味があった Zero Shot Learning について調べてみましたので、共有をさ…

© Sansan, Inc.