Sansan Builders Box

Sansanのものづくりを支える技術やデザイン、プロダクトマネジメントの情報を発信

R&D

第14回テキストアナリティクス・シンポジウムで発表しました

こんにちは。 DSOC R&D グループの高橋寛治です。 2019年2月7日と8日の2日間にわたり京都で開催された第14回テキストアナリティクス・シンポジウムに参加しました。 本記事は、参加報告および発表内容の紹介となります。 テキストアナリティクス・シンポジウ…

「第一回SIL勉強会 自然言語処理編」を開催しました

こんにちは、DSOC R&Dグループ研究員の奥田です。一番好きな京都のお土産は阿闍梨餅です。 先日「第一回SIL勉強会 自然言語処理編」という勉強会を京都で主催しましたので、その様子をご紹介致します。 SIL勉強会とは Sansanでは数年前から京都にオフィスを…

【Techの道も一歩から】第17回「チームで社内データアクセスライブラリを作った話」

こんにちは。 DSOC R&D グループの高橋寛治です。 光陰矢のごとしとはまさにこのことで、気づけば入社して2年が経とうとしています。 今でこそある程度わかってきましたが、入社当初はどこにどんなデータがあり、どのようにアクセスするのかよくわかっていま…

▲The Prism of Creativity ▽ vol.2 [心理学編] 開放性というバロメーター

こんにちは、DSOC研究員の西田です!最近、COMME des GARCONS の2019SSのバラ柄のカットソー&レギンスがお気に入りで、ヘビロテしています。でも、それがはたから見るとタトゥーに見えるらしく、社内の人からは「タトゥー入れたんですか?」とか「タトゥーに…

【つながりに効く、ネットワーク研究小話】vol.7 セレンディピティと社会ネットワーク

Sansan DSOC研究員の前嶋です。「つながりに効く、ネットワーク研究小話」の第7回です。ネットワーク研究の世界で最も興味深い研究トピックの一つが、「社会ネットワークがイノベーションやアイデアの創出に対して与える影響」です。例えば、異なる集団を仲…

【Techの道も一歩から】第16回「Rに入門してテキストマイニング」

こんにちは。 DSOC R&D グループの高橋寛治です。 私が所属する R&D グループでは、プログラミングの使用言語は特に定まっていないので、私は使い慣れている Python を利用しています。 つい最近のことですが、別の研究員が R を用いてワードクラウドを作っ…

【ML Tech RPT. 】第3回 Zero Shot Learning を学ぶ (3)

Sansan DSOC研究員の吉村です。年が明け2019年になり、あと数ヶ月で次の新卒の皆さんが入ってくることを考えて戦々恐々としています。入社してからこれまででしっかりと力がついているのかなど、思いを巡らす対象は多々ありますが、今まで通り日々コツコツと…

「SocSci Meetup~社会科学をブートする~」イベントレポート

Sansan株式会社初の社会科学分野の勉強会 「SocSci Meetup~社会科学をブートする~」が開催された。 Sansan DSOC研究員の前嶋が、当日の熱量そのままに、イベントレポートをお届けする。 SocSciとは 「Tech全盛の時代に、社会科学が立ち上がる。」 "SocSci"…

△The Prism of Creativity▼ vol.1 学問というプリズム

あけましておめでとうございます、DSOC 研究員の西田です。 百貨店のセールが終わり、もう2019SSは何を買おうかと考える日々です。(実際には、正月帰省から戻ってくる新幹線の中でセールにワクワクしながらこのブログを執筆してます。) ちなみに今シーズン…

【R&Dアーキテクト】公立はこだて未来大学で講演してきました

はじめまして*1、DSOC R&Dチームで「R&Dアーキテクト」をしている島といいます。札幌ラボに勤務しています。 アーキテクトではありません。R&Dアーキテクトです。そのわけは後述します。 この度、私の母校である「公立はこだて未来大学 *2」にて、オープン技…

「ビッグデータ時代における新しい社会科学のカタチ」: 行動経済学会第 12 回大会サテライト・ワークショップ

こんにちは、DSOC 研究員の西田です! 一気に寒くなってきて困りますね。最近は、ジャケットの上からニットを着ると意外と暖かいことに気づき、ニューラルネットのように多層レイヤードを楽しんでいます。ジャケットの上からニットを着ていても、「着る順番…

画像処理の自動化と二値化の話

R&D

DSOC R&Dグループの小林です。名刺入力の自動化などを担当しています。画像処理の自動化というのはパラメータへの依存性をいかに取り除くかという点がいつも問題です。 入力フローの様々な場面で画像の二値化をしていますが、二値化という一つの技術をとって…

奈良先端科学技術大学院大学で企業説明会を開催しました

こんにちは、DSOC R&Dグループ研究員の奥田です。奈良で好きなラーメンはみつ葉とNOROMAです。 今回は、奈良先端科学技術大学院大学(通称NAIST)で行われた企業説明会の様子をご紹介します。 NAISTとは NAISTは奈良県生駒市にある大学院大学です。2012年に…

【ML Tech RPT. 】第2回 Zero Shot Learning を学ぶ (2)

Sansan DSOC研究員の吉村です。前回からMachine Learning技術についての連載をはじめました。今回から、弊社のデザイナーに連載用のヘッダ画像を作っていただき、以前にも増してやる気が出ています。 本記事では前回に引き続きZero Shot Learning (ZSL) を紹…

【つながりに効く、ネットワーク研究小話】vol.6 友だちの数に限界はあるか?

Sansan DSOC研究員の前嶋です。「つながりに効く、ネットワーク研究小話」の第6回です。 「ともだち100人」は可能か? 突然ですが、皆さんは「一年生になったら」という歌をご存知でしょうか。幼稚園の卒園式などでよく歌われている童謡です。以下に1番の…

【Techの道も一歩から】第15回「Pythonによる正規表現のまとめ」

こんにちは。 DSOC R&D グループの高橋寛治です。 今回は、何かと忘れて検索しがちな正規表現についてまとめたいと思います。 正規表現の文法やPythonコードによる具体例で書くことで、備忘録としたいと思います。

R&D 社会科学班の論文読み会 vol.5

こんにちは。DSOC R&D Group の真鍋です。 有志で行っている社会科学系の論文読み会の報告をします。 この論文読み会、今は会社の中のクローズな会ですが、近日中に外部に開き、他の企業の研究者の方や大学の研究者、学生の方なども交えて行う予定です。 Com…

「イノベーションはここから生まれる -Sansan Data Discoveryの挑戦」: Sansan Builders Box 2018

こんにちは、DSOC 研究員の西田です! 最近、寒くなってきたのでアウターを着てレイヤードして、ファッションを楽しめる季節になりましたね。今シーズンは、人生で一番服を買っているんじゃないかなというくらい、ファッションを楽しんでいます! さて、今回…

【レポート】IBIS2018で発表してきました

こんにちは、DSOC R&Dグループ研究員の奥田です。イクラ丼とスープカレーで胃もたれを起こしてしまい、加齢を感じる今日この頃です。 2018年11月3日から11月7日にかけて北海道で行われた第21回情報論的学習理論ワークショップ (IBIS 2018)にてポスター発表を…

【つながりに効く、ネットワーク研究小話】vol.5 社会ネットワークと転職

Sansan DSOC研究員の前嶋です。「つながりに効く、ネットワーク研究小話」の第5回です。社会ネットワークと転職についての研究は数多く、この領域は「キング・オブ・ネットワーク研究」と言っても過言ではありません。というのも、様々な社会現象の中で、転…

【ML Tech RPT. 】第1回 Zero Shot Learning を学ぶ (1)

こんにちは、 Sansan DSOC 研究員の吉村です。今年の春新卒として入社しました。専門は機械学習及びクラウドソーシング周りで、現在は予測モデルの作成やワーカのミスの分析などを行なっています。こちらの連載では、自身の勉強を兼ねて普段の業務やその周辺…

ウェブサイエンス研究会オープンセミナーで登壇しました

Sansan DSOC研究員の前嶋です。季節の変わり目なので、風邪予防のためにどんな栄養素を摂るべきなのかを日々調べています。こういう時、Cochran LibraryやPubMedを使うと、医学・公衆衛生の最新の研究成果に簡単にアクセスできるので便利ですね。さて、10/7(…

【Techの道も一歩から】第14回「出現頻度と連接頻度に基づく専門用語抽出器を実装してみる」

こんにちは。 DSOC R&D グループの高橋寛治です。 最近、アルゴリズムを実装して勉強することにハマっています。 ある程度理解しないと実装できないですし、そもそも実装したものが動くということは非常に嬉しいものです。 さて、今回は最近実装した「出現頻…

【つながりに効く、ネットワーク研究小話】vol.4 「類は友を呼ぶ」の科学

Sansan DSOC研究員の 前嶋 です。「つながりに効く、ネットワーク研究小話」の第4回です。 これまで解説してきた通り、ネットワーク理論の特徴は、私たちのつながりの構造的な側面を捉えるという点にあります。しかし、時として「どのような人がどのような人…

【Techの道も一歩から】第13回「文書や単語をどうやって表現するかコサイン類似度で学ぶ」

こんにちは。 DSOC R&D グループの高橋寛治です。 前回のTF-IDFで、使ってはいたけれど触れなかった文書や単語の表現方法について述べます。 実際に文書をベクトルとして表現し、コサイン類似度を計算することで理解を深めます。 scikit-learnを使わずにでき…

【レポート】勉強会「R&Dにおけるデータエンジニアリング/アーキテクチャー」

こんにちは。DSOC Data Direction Group / R&Dの千葉です。前回の勉強会に続き、2018年9月7日に開催された第二回R&D勉強会の内容についてお伝えします。今回は「R&Dにおけるデータエンジニアリング/アーキテクチャー」と題して、R&D groupを取り巻く環境の…

R&D 社会科学班の論文読み会 vol.4

DSOC R&D Group の真鍋です。 Sansan DSOC で行なっている、主に社会ネットワークに関する論文読み会のレポート第 4 弾です。昼ごはんを食べながらやっています。 メンバーは前嶋と戸田です。 これまでは Sansan mimi blog で連載をしておりました。今回は、…

Web DB Forum 2018 で登壇してきました!

こんにちは! DSOC R&D Groupの吉村 皐亮です。 入社して約半年が経ち、最近では徐々に会社にも馴染んで来て、自分の色が出せるようになってきたかなと思う今日この頃です。さて、今回は今年の9月12日から9月14日にかけて、東京工業大学大岡山キャンパスで開…

【つながりに効く、ネットワーク研究小話】vol.3 出会わせない、が、世界史を変えていた

Sansan DSOC研究員の前嶋です。「つながりに効く、ネットワーク研究小話」の第3回です。前回まではmimiブログで連載していましたが、今回からはSansan Builders Boxに移ります。本連載は直接的に技術を解説するものではないですが、「人と人とのつながりに対…

【Techの道も一歩から】第12回「基礎的な考え方であるTF-IDFを学ぶ」

Techの道も一歩から こんにちは。 DSOC R&D グループの高橋寛治です。 前回のブログの終わりに書きましたが、今回からは言語処理のアルゴリズムの紹介を行います。 ただ単にアルゴリズムを紹介するだけではなく、実際に実装し動作させた結果も掲載することで…

© Sansan, Inc.