Sansan Tech Blog

Sansanのものづくりを支えるメンバーの技術やデザイン、プロダクトマネジメントの情報を発信

Google Cloud Next '18 in Tokyo で Sansan の GCP 利用について話してきました

f:id:jaranz:20180928203603j:plain

こんにちは。 Data Strategy & Operation Center(DSOC) で開発のマネージャーをしている永井です。 9/19、9/20 に開催された Google Cloud Next '18 in Tokyo で話をしてきたのでその紹介となります。

Google Cloud Next '18 in Tokyo

初日の基調講演の Google Cloud CEO であるダイアン グリーンさんとファーストリテイリングの柳井さんの対談にあった話。リスクを取ること。新しいことをやればだいたい失敗する。1 勝 9 敗。 1 勝 99 敗かもしれない。それでも、とにかく諦めない。早く失敗して、早く考えて、早くトライする。そのための情報の整理、共有をベースとした早い決断は大事。という話も印象的ながら、最終的に対談のペースを自分のペースにもっていく柳井さんにすごさを感じながらイベントスタートです。

続きを読む

【Techの道も一歩から】第13回「文書や単語をどうやって表現するかコサイン類似度で学ぶ」

f:id:s_yuka:20180928134040j:plain

こんにちは。 DSOC R&D グループの高橋寛治です。

前回のTF-IDFで、使ってはいたけれど触れなかった文書や単語の表現方法について述べます。 実際に文書をベクトルとして表現し、コサイン類似度を計算することで理解を深めます。

scikit-learnを使わずにできる限りnumpyを利用してコードを記述してみます。 ノートブックはこちらにあります。

ベクトルで取り扱うと計算しやすい

自然言語を取り扱う研究では、文書や単語といったように自然言語を何らかの単位で取り扱います。 自然言語処理でも活用される機械学習手法は、数式で表現されるものであり、データやその演算はベクトルで取り扱われています。

自然言語処理を機械学習で取り扱うために、文書や単語をベクトル化します。 前回紹介したTF-IDFの場合は、文書を単語で構成されたベクトルとしていました。

ベクトル化する単語や文書とは何かを述べていきます。

続きを読む

Google Cloud Next '18 in Tokyo 参加ノート

DSOC Development Group の 木田 です。

先日行われた Google Cloud Next '18 in Tokyo に参加してきました。

cloud.withgoogle.com

今までは AWS を中心に触ってきたので、GCP のホットな話題にも触れたいと思い、参加しました。個人的には、最近 Firebase に注目しているので、その話を聞けるのも楽しみでした。

本ブログは、私がセッションを聞きながら取ったメモを、まとめたものになります。セッション後に独自で調べた内容も追加しています。6セッション分と、かなりボリュームがあるので箇条書きととさせていただきました。

イベントに参加できなかった方や、聞きたいけど聞けなかったセッションがある方などのお役に立てば良いな、と思います。

続きを読む

【レポート】勉強会「R&Dにおけるデータエンジニアリング/アーキテクチャー」

f:id:hartmann3555:20180925121557j:plain

こんにちは。DSOC Data Direction Group / R&Dの千葉です。

前回の勉強会に続き、2018年9月7日に開催された第二回R&D勉強会の内容についてお伝えします。

今回は「R&Dにおけるデータエンジニアリング/アーキテクチャー」と題して、R&D groupを取り巻く環境の中でも、開発環境や分析基盤にフォーカスを当ててお話しました。

続きを読む

R&D 社会科学班の論文読み会 vol.4

f:id:s_yuka:20180925163445j:plain

DSOC R&D Group の真鍋です。
Sansan DSOC で行なっている、主に社会ネットワークに関する論文読み会のレポート第 4 弾です。昼ごはんを食べながらやっています。
メンバーは前嶋と戸田です。
これまでは Sansan mimi blog で連載をしておりました。

今回は、最初に、人の「つながりの消失」についての論文が紹介されました。

続きを読む

Web DB Forum 2018 で登壇してきました!

こんにちは! DSOC R&D Groupの吉村 皐亮です。
入社して約半年が経ち、最近では徐々に会社にも馴染んで来て、自分の色が出せるようになってきたかなと思う今日この頃です。

さて、今回は今年の9月12日から9月14日にかけて、東京工業大学大岡山キャンパスで開催されたWeb DB Forum 2018に参加してきましたので、その模様を報告します。ちなみに、Web DB ForumにSansan株式会社の Data Strategy & Operation Center (DSOC)が参加するのは、昨年に引き続き2回目となります。

f:id:ssatsuki040508:20180919174304j:plain

続きを読む

Building Eight's activity feed

f:id:s_yuka:20180919143127j:plain


Hello, this is Carlos, from the Eight engineering team.

I joined Sansan about a year ago, and since I came here, I have been working on the Eight's feed team.

What is Eight's feed you ask?

Well, If you are a user of Eight, you probably know that when any important event regarding any of your contacts (switching companies or getting a promotion) you get that information delivered right to you.

At Eight's feed team, we are working hard to make it happen, and we do hope you are happy with the news and the information we are delivering to you.

In order to make this happen, there are lots of things happening in the background, some of them are really interesting if you are an engineer or if you like complex system with lots of moving pieces working together.

続きを読む

© Sansan, Inc.