Sansan Builders Box

Sansanのものづくりを支える技術やデザイン、プロダクトマネジメントの情報を発信

R&D

【Intern CV Report】超解像の歴史探訪 -2016年編-

こんにちは,DSOC R&Dグループ インターン生の内田です. 前回の記事が割合好評とのことで,この度めでたく連載を持つことになりました. 記事を読んでいただいた方や記事のレビューをしていただいた方に感謝申し上げます. これからも読んでいただける記事…

文章埋め込みを用いた教師なしキーフレーズ抽出EmbedRankの実装とその評価

R&D

こんにちは、DSOC R&Dグループ研究員の奥田です。言語処理学会年次大会(NLP2019)の開催されている名古屋のホテルで今まさにこの記事を書いています。ひつまぶし美味しかったです。 さて、今回はCONLL 2018で発表されたSimple Unsupervised Keyphrase Extra…

DEIM 2019に参加して来ました!

DEIM 2019 が催されたホテルオークラJRハウステンボス。Sansan DSOC 研究員の吉村です。最近は社内のカフェで提供してくださっている「オリジナルジンジャーシロップ」のソーダ割りにハマっています。風邪予防になることを期待しつつ、頻繁に飲んでいます。…

▲The Prism of Creativity ▽ vol.3[心理学編] 孤独とクリエイティビティ

こんにちは、DSOC研究員の西田です!この間、Cから始まる僕がこよなく愛しているブランドの本店に訪れたとき、そこに居合わせたお客さんが私のことを店員と思ったようで、「この財布をください!」と声をかけられてしまいました。店員になりきろうかとも思い…

【ML Tech RPT. 】第4回 不均衡データ学習 (Learning from Imbalanced Data) を学ぶ(1)

Sansan DSOC 研究員の吉村です。最近は憩いの場を求めて、休日に都内の図書館をまわるのが趣味になっています。先輩にこの話をしたところ、国会図書館をオススメされたので、近々行ってみようと思っている今日この頃です。さて、今回は実データを分析する時…

ネットワーク分析の基礎 〜関東地方の路線図の特徴〜

こんにちは,DSOC R&Dグループ インターン生の吉田と申します. 2017年のサマーインターンに参加して以来,1年半程こちらでお世話になっておりますが,この春に就職を控えていることもあり、この度2月末で退社させていただくことになりました.従って,これ…

PyTorchと超解像に入門する

こんにちは,DSOC R&Dグループ インターン生の内田と申します.昨夏のR&Dインターンにも参加しており,実はSansanのブログのどこかに登場済みです.夏のインターンではデータ分析周りを経験させていただきましたが,大学での専門が画像処理ということもあり…

第14回テキストアナリティクス・シンポジウムで発表しました

こんにちは。 DSOC R&D グループの高橋寛治です。 2019年2月7日と8日の2日間にわたり京都で開催された第14回テキストアナリティクス・シンポジウムに参加しました。 本記事は、参加報告および発表内容の紹介となります。 テキストアナリティクス・シンポジウ…

「第一回SIL勉強会 自然言語処理編」を開催しました

こんにちは、DSOC R&Dグループ研究員の奥田です。一番好きな京都のお土産は阿闍梨餅です。 先日「第一回SIL勉強会 自然言語処理編」という勉強会を京都で主催しましたので、その様子をご紹介致します。 SIL勉強会とは Sansanでは数年前から京都にオフィスを…

【Techの道も一歩から】第17回「チームで社内データアクセスライブラリを作った話」

こんにちは。 DSOC R&D グループの高橋寛治です。 光陰矢のごとしとはまさにこのことで、気づけば入社して2年が経とうとしています。 今でこそある程度わかってきましたが、入社当初はどこにどんなデータがあり、どのようにアクセスするのかよくわかっていま…

▲The Prism of Creativity ▽ vol.2 [心理学編] 開放性というバロメーター

こんにちは、DSOC研究員の西田です!最近、COMME des GARCONS の2019SSのバラ柄のカットソー&レギンスがお気に入りで、ヘビロテしています。でも、それがはたから見るとタトゥーに見えるらしく、社内の人からは「タトゥー入れたんですか?」とか「タトゥーに…

【つながりに効く、ネットワーク研究小話】vol.7 セレンディピティと社会ネットワーク

Sansan DSOC研究員の前嶋です。「つながりに効く、ネットワーク研究小話」の第7回です。ネットワーク研究の世界で最も興味深い研究トピックの一つが、「社会ネットワークがイノベーションやアイデアの創出に対して与える影響」です。例えば、異なる集団を仲…

【Techの道も一歩から】第16回「Rに入門してテキストマイニング」

こんにちは。 DSOC R&D グループの高橋寛治です。 私が所属する R&D グループでは、プログラミングの使用言語は特に定まっていないので、私は使い慣れている Python を利用しています。 つい最近のことですが、別の研究員が R を用いてワードクラウドを作っ…

【ML Tech RPT. 】第3回 Zero Shot Learning を学ぶ (3)

Sansan DSOC研究員の吉村です。年が明け2019年になり、あと数ヶ月で次の新卒の皆さんが入ってくることを考えて戦々恐々としています。入社してからこれまででしっかりと力がついているのかなど、思いを巡らす対象は多々ありますが、今まで通り日々コツコツと…

△The Prism of Creativity▼ vol.1 学問というプリズム

あけましておめでとうございます、DSOC 研究員の西田です。 百貨店のセールが終わり、もう2019SSは何を買おうかと考える日々です。(実際には、正月帰省から戻ってくる新幹線の中でセールにワクワクしながらこのブログを執筆してます。) ちなみに今シーズン…

【R&Dアーキテクト】公立はこだて未来大学で講演してきました

はじめまして*1、DSOC R&Dチームで「R&Dアーキテクト」をしている島といいます。札幌ラボに勤務しています。 アーキテクトではありません。R&Dアーキテクトです。そのわけは後述します。 この度、私の母校である「公立はこだて未来大学 *2」にて、オープン技…

「ビッグデータ時代における新しい社会科学のカタチ」: 行動経済学会第 12 回大会サテライト・ワークショップ

こんにちは、DSOC 研究員の西田です! 一気に寒くなってきて困りますね。最近は、ジャケットの上からニットを着ると意外と暖かいことに気づき、ニューラルネットのように多層レイヤードを楽しんでいます。ジャケットの上からニットを着ていても、「着る順番…

画像処理の自動化と二値化の話

R&D

DSOC R&Dグループの小林です。名刺入力の自動化などを担当しています。画像処理の自動化というのはパラメータへの依存性をいかに取り除くかという点がいつも問題です。 入力フローの様々な場面で画像の二値化をしていますが、二値化という一つの技術をとって…

奈良先端科学技術大学院大学で企業説明会を開催しました

こんにちは、DSOC R&Dグループ研究員の奥田です。奈良で好きなラーメンはみつ葉とNOROMAです。 今回は、奈良先端科学技術大学院大学(通称NAIST)で行われた企業説明会の様子をご紹介します。 NAISTとは NAISTは奈良県生駒市にある大学院大学です。2012年に…

【ML Tech RPT. 】第2回 Zero Shot Learning を学ぶ (2)

Sansan DSOC研究員の吉村です。前回からMachine Learning技術についての連載をはじめました。今回から、弊社のデザイナーに連載用のヘッダ画像を作っていただき、以前にも増してやる気が出ています。 本記事では前回に引き続きZero Shot Learning (ZSL) を紹…

【つながりに効く、ネットワーク研究小話】vol.6 友だちの数に限界はあるか?

Sansan DSOC研究員の前嶋です。「つながりに効く、ネットワーク研究小話」の第6回です。 「ともだち100人」は可能か? 突然ですが、皆さんは「一年生になったら」という歌をご存知でしょうか。幼稚園の卒園式などでよく歌われている童謡です。以下に1番の…

【Techの道も一歩から】第15回「Pythonによる正規表現のまとめ」

こんにちは。 DSOC R&D グループの高橋寛治です。 今回は、何かと忘れて検索しがちな正規表現についてまとめたいと思います。 正規表現の文法やPythonコードによる具体例で書くことで、備忘録としたいと思います。

R&D 社会科学班の論文読み会 vol.5

こんにちは。DSOC R&D Group の真鍋です。 有志で行っている社会科学系の論文読み会の報告をします。 この論文読み会、今は会社の中のクローズな会ですが、近日中に外部に開き、他の企業の研究者の方や大学の研究者、学生の方なども交えて行う予定です。 Com…

「イノベーションはここから生まれる -Sansan Data Discoveryの挑戦」: Sansan Builders Box 2018

こんにちは、DSOC 研究員の西田です! 最近、寒くなってきたのでアウターを着てレイヤードして、ファッションを楽しめる季節になりましたね。今シーズンは、人生で一番服を買っているんじゃないかなというくらい、ファッションを楽しんでいます! さて、今回…

【レポート】IBIS2018で発表してきました

こんにちは、DSOC R&Dグループ研究員の奥田です。イクラ丼とスープカレーで胃もたれを起こしてしまい、加齢を感じる今日この頃です。 2018年11月3日から11月7日にかけて北海道で行われた第21回情報論的学習理論ワークショップ (IBIS 2018)にてポスター発表を…

【つながりに効く、ネットワーク研究小話】vol.5 社会ネットワークと転職

Sansan DSOC研究員の前嶋です。「つながりに効く、ネットワーク研究小話」の第5回です。社会ネットワークと転職についての研究は数多く、この領域は「キング・オブ・ネットワーク研究」と言っても過言ではありません。というのも、様々な社会現象の中で、転…

【ML Tech RPT. 】第1回 Zero Shot Learning を学ぶ (1)

こんにちは、 Sansan DSOC 研究員の吉村です。今年の春新卒として入社しました。専門は機械学習及びクラウドソーシング周りで、現在は予測モデルの作成やワーカのミスの分析などを行なっています。こちらの連載では、自身の勉強を兼ねて普段の業務やその周辺…

【Techの道も一歩から】第14回「出現頻度と連接頻度に基づく専門用語抽出器を実装してみる」

こんにちは。 DSOC R&D グループの高橋寛治です。 最近、アルゴリズムを実装して勉強することにハマっています。 ある程度理解しないと実装できないですし、そもそも実装したものが動くということは非常に嬉しいものです。 さて、今回は最近実装した「出現頻…

【つながりに効く、ネットワーク研究小話】vol.4 「類は友を呼ぶ」の科学

Sansan DSOC研究員の 前嶋 です。「つながりに効く、ネットワーク研究小話」の第4回です。 これまで解説してきた通り、ネットワーク理論の特徴は、私たちのつながりの構造的な側面を捉えるという点にあります。しかし、時として「どのような人がどのような人…

【Techの道も一歩から】第13回「文書や単語をどうやって表現するかコサイン類似度で学ぶ」

こんにちは。 DSOC R&D グループの高橋寛治です。 前回のTF-IDFで、使ってはいたけれど触れなかった文書や単語の表現方法について述べます。 実際に文書をベクトルとして表現し、コサイン類似度を計算することで理解を深めます。 scikit-learnを使わずにでき…

© Sansan, Inc.