Sansan Tech Blog

Sansanのものづくりを支えるメンバーの技術やデザイン、プロダクトマネジメントの情報を発信

連載

【ML Tech RPT. 】第17回 構造に関連する機械学習を学ぶ (3) ~時系列予測~

DSOC研究員の吉村です. 最近, 調理器具を集めるのにハマっていて, 耐熱性のゴムベラを購入しました. 火にかけながら利用できるのが非常に使いやすく, 直近での一番いい買い物だったと感じています. さて, 今回も引き続き構造に関する機械学習の話題です. 前…

【Techの道も一歩から】第29回「PythonでPDFに文字を埋め込む」

こんにちは。DSOC 研究開発部の高橋寛治です。 いつもお世話になっている PDF ファイルを対象に Python3 で操作します。 PDF ファイルを読み込み、文字を書き込んで、「Hello World!」と世界に挨拶をする方法を紹介します。

【Zoom or Die】第1回 NTIRE2020 Challenge 結果速報

こんにちは,DSOC 研究開発部の内田です. 今年の4月に新卒入社いたしました,と言っても以前からインターンしていた関係で連載を持たせてもらっていたので,SBB内では連載のリニューアルの意味合いの方が強いです. コロナ禍により執筆時点で入社後一度も出…

Economics Meets Data Science: The Structural Estimation Series Part III

Today's Agenda Hello again. I'm DSOC's Juan. It's time for the part III of the Structural Estimation Series. In the last post I described the dynamic optimization problem of Harold Zurcher according to Rust (1987), and presented some impor…

Hands-on guidance to DGL library _ (1) Introduction and Message Passing

Hi, I am XING LI, a researcher from Sansan DSOC. Graph is a more general data form to describe our world. Sansan DSOC is creatively exploiting graph data to mining new value for benefitting customers. To coin a phrase, sharp tools make goo…

【Geek Seek Toolsで買われた、気になるモノ達】第12回「Niz Plum 84(静電容量無接点スイッチ キーボード)」

はじめに こんにちは。DSOC Data Direction Group でデータエンジニアをしている千葉祐大です。前回の記事で心配していたコロナ禍で危ぶまれたネット回線の開通工事は、今月中に実施できると業者から連絡を受けたので安心している最近です。さて、この連載は…

歴史をたどってディープラーニングを学ぶ第六回 M対Nのコンボリューションでカラー画像を扱う

こんにちは、ニューラルネット老人こと糟谷勇児です。今回は色について考えていきます。 色を扱うのは難しい 画像認識といえば色の活用が重要そうですが、実際は一筋縄ではいきません。 私が新入社員だったころのことです。 中国人の先輩が画像検索エンジン…

【Techの道も一歩から】第28回「深層学習による物体検出で遊んでみる」

こんにちは。DSOC 研究開発部の高橋寛治です。 新型コロナウイルス感染症対策では、外出自粛を徹底することが大事とされており、自宅でできる遊びを日々模索中です。 さて、今回は自宅のノートパソコンや物を使って、深層学習による物体検出で遊びます。 物…

▲The Prism of Creativity ▽ vol.8 商品パッケージをつくるシステム [機械学習編]

こんにちは、Sansan DSOC 研究員の西田です。 最近は、外に出れずせっかく購入した春夏物が着れないので、かわりに在宅勤務時には香水をつけて気分を高めています。 次のパリコレは無事に開催されることを祈っています。さて、前回の記事では、Computational…

【ML Tech RPT. 】第16回 構造に関連する機械学習を学ぶ (2) ~系列ラベリング~

DSOC研究員の吉村です. 昨今の情勢により, 外食をすることが難しくなり, 私も自炊をするようにしました. 折角自炊をするのでスキルを高めたいと思い, 最近はオムレツを綺麗に焼く練習ばかりしています. その結果, 一日にかなりの数の卵を食べてしまっている…

【つながりに効く、ネットワーク研究小話】vol.14 もう一つの「社会的距離」

Sansan DSOC研究員の前嶋です。「つながりに効く、ネットワーク研究小話」の第14回です。本来は今頃、夏鳥を観察しに戸隠高原に遠征する予定だったのですが、新型コロナウイルス禍の中で、自宅待機を余儀なくされています。 ソーシャル・ディスタンシング こ…

【Geek Seek Toolsで買われた、気になるモノ達】第11回「Logicool G304(無線ゲーミングマウス)」

はじめに こんにちは。DSOC Data Direction Group でデータエンジニアをしている千葉祐大です。直近半年で新居を購入し絶賛建築中だったのですが、予定どおり引っ越しはできそうなものの、新型コロナの影響で工期自体は伸びて周りの足場が外せないらしく、結…

歴史をたどってディープラーニングを学ぶ 第五回 LeNetは何を学習したのか

こんにちは、ニューラルネット老人こと糟谷勇児です。 最近、黄鉄鉱化したアンモナイトの化石を買ってみました。 化石は地面に埋まった骨や殻が、長い時間をかけて周りの地盤の成分に置換されていき、中身は元の成分ではなく、周りの成分に置き換わっている…

【Techの道も一歩から】第27回「BERTで作ってみた日本語固有表現抽出器の推論部分を書く」

こんにちは。DSOC 研究開発部の高橋寛治です。 今回は、前回の 「BERTで日本語固有表現抽出器を作ってみた」 に続き、作った固有表現抽出器をWebAPI化します。 モデルを把握する transformers ライブラリの 固有表現抽出のサンプル を流用してモデルを作成し…

▲The Prism of Creativity ▽ vol.7 機械と協働してクリエイティブに[機械学習編]

こんにちは!Sansan DSOC 研究員の西田です。最近は密かに髪の色をブルーブラックにしましたが、自然光に当たらないと青くならないため、誰にも気づかれません。烏のような黒髪を目指していきたいと思います。 先日までMedia Ambition Tokyo 2020に出会いの…

【Geek Seek Toolsで買われた、気になるモノ達】番外編2「Sansanで人気のあったガジェットまとめ(2019年版)」

はじめに こんにちは。DSOC Data Direction Group でデータエンジニアをしている千葉祐大です。今年の初めくらいから手書きでのジャーナリングを始めているのですが「やっぱり良いモノを使いたいよね」ということで、お高いノートや筆記用具を日々物色してい…

【ML Tech RPT. 】第15回 構造に関連する機械学習を学ぶ (1)

DSOC研究員の吉村です. 最近は (ファッション誌ではなく) ファッション史にハマっていて, 色々本をあさっています. 世の中の流れをファッションで変えてきたクリエイターやデザイナーの逸話はとても面白いです.さて, 今回からは構造に関連する機械学習につい…

【Intern CV Report】Trainsによる実験管理

こんにちは,DSOC 研究開発部 インターン生の内田です.先日プチ卒業旅行として伊豆の温泉旅館に行ってきました.伊豆といえば バナナワニ園 ですよね,異論は認めません.バナナワニ園のワニたちは基本的に動かないので思わず「休日の俺じゃん」って呟いて…

【Techの道も一歩から】第26回「BERTで日本語固有表現抽出器を作ってみた」

こんにちは。DSOC 研究開発部の高橋寛治です。 流行りの BERT(Bidirectional Encoder Represenations from Transformers) ですが、論文を読んだあと、マスク部分を当てるというサンプルを動かしその的確さに驚いたところで、手が止まっていました。 今回は、…

B2B 企業ブランドとは何か vol.3

こんにちは。DSOC研究開発部の真鍋です。 今回は、B2Bブランドに関する論文の例として、Brand equity in the business-to-business market (Industrial Marketing Management, 33(5), 371–380, Bendixen, M., Bukasa, K. A., & Abratt, R.) という論文を、以…

【つながりに効く、ネットワーク研究小話】vol.13 「やぁやぁ、知ってる?」―噂と社会ネットワーク

Sansan DSOC研究員の前嶋です。随分とご無沙汰してしまいました。「つながりに効く、ネットワーク研究小話」の第13回です。先日、新宿御苑に独りで散歩に出かけたのですが、早咲きの桜の木に野鳥が集まっていました。双眼鏡でよく観察してみると、ヒヨドリの…

歴史をたどってディープラーニングを学ぶ 第四回 LeNetを作ってコンボリューショナルネットを学ぶ

こんにちは、DeepLearning老人こと糟谷勇児です。 会社では老人ですが、地域活動コミュニティでは若者扱いされギャップに驚いています。 そんなわけで今回もDeepLearningを学んでいきたいと思います。 前回はパーセプトロンを多層化することで画像認識の精度…

【ML Tech RPT. 】第0回 本連載を書くことについて

DSOC研究員の吉村です. 私の好きな歌の歌詞の中に、「案外第0話って後から書かれるよね」みたいなことが書いてあります。(具体的に書くと、どの曲なのかがわかるので雰囲気で書いてます。)さて, 本連載もそれなりに回数を重ねてきたので, その歌詞のごとく第…

【Techの道も一歩から】第25回「できる限りわかりやすく規則による前処理・後処理を記述する」

こんにちは。 DSOC R&D グループの高橋寛治です。 テキストに対して何かしらのアルゴリズムにより結果を得た際に、どうしても出力したくない項目や、少し前処理を書けば改善される、といったことがあります。 例えば機械学習の出力を調整するには、パラメー…

【Geek Seek Toolsで買われた、気になるモノ達】番外編「自費で購入した生産性向上グッズ」

はじめに こんにちは。DSOC Data Direction Group でデータエンジニアをしている千葉祐大です。冬も本番になり、空気も乾燥してきましたね。 僕も最近肌の乾燥が気になりつつあり、今までは化粧水を変えたり加湿器を導入したりと外部からのアプローチで対策…

【ML Tech RPT. 】第14回 機械学習のモデルの評価方法 (Evaluation Metrics) を学ぶ (5)

DSOC研究員の吉村です. 年末年始の連休で本をたくさん読むぞと意気込んだにも関わらず, 2.5冊しか読めなかった悔しさに苛まれております. さて, 今回も前回に引き続き評価指標についてまとめていきます. 特に, ランキング学習の出力結果を評価する際に用いら…

【Techの道も一歩から】第24回「高速かつ省メモリな辞書ライクなライブラリDAWG」

こんにちは。 DSOC R&D グループの高橋寛治です。 Pythonの辞書オブジェクトは取り扱いやすいため、単語とIDの変換テーブルを作ったり、複合語の結合のためにデータ構造を工夫して簡易なトライ木を構築したりと、自分でコーディングすることがあるかと思いま…

歴史をたどってディープラーニングを学ぶ 第三回 Cifar10と勾配消失問題についての考察

こんにちは、ニューラルネット老人こと糟谷勇児です。 最近は恐竜に凝っていて化石を買ったりしています。ニューラルネット界の化石と化してしまう前に、今回もディープラーニングを勉強していきたいと思います。さて、前回はReLUについて自作のプログラムで…

【つながりに効く、ネットワーク研究小話】vol.12 強いつながりの条件

Sansan DSOC研究員の前嶋です。「つながりに効く、ネットワーク研究小話」の第12回です。静電気が怖いので、オフィスでは放電のために靴を履かずに過ごしているのですが、気を抜くとすぐに”””バチッ”””ときます。とても悲しいです。おすすめの対策法があれば…

Economics Meets Data Science: ML and Economics Together at Last

Hello again, Internet! It's December now, the season of presents, Christmas carols, parties, catching colds and eating fried chicken. This time I'm taking a break from the Structural Estimation Series. Instead, I'll discuss a topic that I …

© Sansan, Inc.