Sansan Tech Blog

Sansanのものづくりを支えるメンバーの技術やデザイン、プロダクトマネジメントの情報を発信

黒木 の検索結果:

NLP2023に参加・発表しました

…にちは!研究開発部の黒木裕鷹です。 先日、沖縄のコンベンションセンターで開催された言語処理学会第29回年次大会(NLP2023)に参加してきました。 3月13日から3月17日までの開催で、多くの研究者や技術者が一堂に会し、最新の研究成果や技術動向を共有しました。 オンラインとオフラインのハイブリッド開催でしたが、セッション会場も大規模なポスター会場・企業ブースも常に賑わっていて、コロナ禍前の学会を思い出しました。 また、会期中にはGPT-4がリリースされたことなどもあり、規模…

【ネットワークの統計解析】第12回 株式市場とネットワーク分析 (1)

…にちは.研究開発部の黒木裕鷹です.前回の記事から大分時間が空いてしまいました. 12月に宮崎で開催される青島太平洋マラソン2022にエントリーしました. ベスト(ネットタイムで3時間58分)を更新できるよう頑張りたいのですが,あまりの暑さで思うように練習できていません. 涼しい夜を狙ってしっかりスピード練習をして,秋のロング走でしっかりタイムを伸ばしたいところです. さて,この連載では,自分の勉強・復習も兼ねて,ネットワークデータにまつわる統計(機械学習)の解析を気の向くまま…

2022年度人工知能学会に参加しました!

…たチラシとレポート 黒木・真鍋によるポスター発表 「ECS-BERT モデルによるステークホルダー評価の定量化とその財務特性」というテーマで、研究開発部の真鍋・黒木がポスター発表を行いました。 セッションは大盛況だったようです。 黒木・真鍋によるポスター発表 まとめと感想 簡単ではありますが、Sansanにおける学会活動について紹介しました。 普段の業務では他社の方々と交流する機会が少ないので、オフラインの学会は貴重な経験となりました。 最後にSansanでは一緒に働く仲間を…

【ネットワークの統計解析】第11回 「NeurIPS'21 読み会」「AAAI'22 読み会」で発表してきました

…ちは. 研究開発部の黒木裕鷹です. ついに初めてフルマラソン(長野マラソン)に出場しました. タイムはネットで 3:58:25 で,サブ4を達成することができました! 次の目標はサブ3.5(3時間半切り)でしょうか.道のりは遠いです. さて先日,LINE株式会社主催の「NeurIPS'21 読み会」,そして「AAAI'22 読会」で発表する機会をいただきました. このシリーズの論文読み会も ICML'21, KDD'21 に続き早くも3, 4回目で,ありがたいことに毎度発表の…

【ネットワークの統計解析】第10回 PageRank とその周辺を探りたい

…SOC 研究開発部の黒木裕鷹です. 膝が痛いです. やってしまいました. なまじ走れるようになってきたのが楽しく,まだ脚ができてないにも関わらず走りすぎてしまいました... 調べてみたところ,膝の外側の靭帯(腸脛靭帯)と前十字靭帯を交互に痛めてしまったようです. ストレッチや筋トレに取り組み衝撃を吸収できる脚作りをすることはもちろんですが,靭帯をより強靭にするために研究を追ったりしているので,機会があればそのうち共有したいと思います. さて,この連載では,自分の勉強・復習も兼…

【ネットワークの統計解析】第9回 「ICML'21読み会」「KDD'21読み会」で発表してきました

…SOC 研究開発部の黒木裕鷹です. なんとハーフマラソンにエントリーしてしまいました.思いつきって怖いですね. やるからには良いタイムで走りたいと思い,2時間切りを目標に練習しています. とはいえインターネットの記事や Youtube でしか情報収集していないため,良いトレーニングができていないかもしれません. どなたか知見をお持ちの方がいらっしゃったら是非ご教授ください. 先日,LINE株式会社主催の2つの論文読み会で発表する機会をいただきました. 私が紹介した2本の論文は…

BERTによる日本語固有表現抽出の精度改善 〜BERT-CRFの紹介〜

…のですが、メンターの黒木や高橋寛治をはじめ、多くの研究員の方にご協力いただき、精度改善、プロダクトに反映させることができました。 今後ともプロダクトに貢献できるような精度改善に邁進していきます! 参考文献 [1] Souza, F., Nogueira, R., and Lotufo, R. (2019). Portuguese named entity recognition using bert-crf. arXiv:1909.10649. *1:大規模な学習データセット…

書評:『施策デザインのための機械学習入門』

…SOC 研究開発部の黒木裕鷹です. なんと,思いつきで始めたランニングが続いており,最初の1ヶ月は65kmほど走っていたようです! やはり,ばっちり形から入りかっこいいシューズとウェアを用意したのが効いたようです. フルマラソン目指して頑張りたいと思います🏃 さて,先日株式会社ホクソエムの高柳さんより,監修された本をご恵贈いただきました! ありがとうございます!!! いつもはネットワークの分析手法にまつわる連載をしていましたが,せっかくですので,今回は書籍のレビュー・紹介をし…

【ネットワークの統計解析】第8回 事例紹介「Uber における GNN の活用」

…SOC 研究開発部の黒木裕鷹です. 夏の訪れを感じつつある最近ですが,ランニングをはじめました. 形から入ろうと思い,かっちょいいシューズとウェアを揃えたのですが,なんとか1週間は続いており気分が良いです. まだまだ2, 30分走るだけでバテバテになってしまいますが,いずれは健康大魔神になろうと思っています. さて,この連載では,自分の勉強・復習も兼ねて,ネットワークデータにまつわる(統計)解析を気の向くままに紹介しています. 前回の記事では,グラフラプラシアン・グラフフーリ…

【ネットワークの統計解析】第7回 グラフラプラシアン・グラフフーリエ変換を簡単に振り返る

…SOC 研究開発部の黒木裕鷹です.また自粛期間が長くなってきましたね. 私も健康を取り戻さねばと思い,マルチビタミンやDHA,食物繊維を積極的に取り入れています.ハイボールに食物繊維を溶かすのが,罪悪感とアルコールが薄まり気分良く飲めるのでおすすめです.その名もトクホハイボールです. さて,この連載では,自分の勉強・復習も兼ねて,ネットワークデータにまつわる(統計)解析を気の向くままに紹介しています. 前回の記事では,GNN を使った分析例として,拡散ネットワークからフェイク…

【ネットワークの統計解析】第6回 論文紹介1「GCNを用いたフェイクニュースの検知」

…SOC 研究開発部の黒木裕鷹です.先月も,今月も,また服を買ってしまいました. 出かける先はコンビニぐらいしかないのですが,おしゃれをすると心が躍り,陳列商品も不思議とキラキラして見えますね. さて,この連載では,自分の勉強・復習も兼ねて,ネットワークデータにまつわる統計解析を気の向くままに紹介しています. 前回の記事では,ネットワークデータに対する深層学習 (Graph Neural Network; GNN) を俯瞰し,直感的に全体像を把握するような導入をしました. 今回…

「分析コンペ勉強会」を開催しました

…anからは、研究員 黒木(@kur0cky_y)が登壇しました。手伝ってくれてありがとうございます!本当に助かりました! 参加者は? 当日の参加者数は550名となりました。 大変多くの方に参加頂けました。 アンケート結果は? 満足度 82%の人から非常に満足という高評価を頂きました。 また、コメントからWordCloudを作成してみました。 コメント WordCloud ポジティブな意見を多く頂けて嬉しい限りです。もちろん反省点もありますので、次回以降にしっかり反映させていき…

【ネットワークの統計解析】第5回 代表的なネットワークのモデルを俯瞰する (3)

…SOC 研究開発部の黒木裕鷹です. 2回目の緊急事態が宣言され,昇降デスクを買ったりモニターや服を買い足したりしていました. お財布は寂しいですが,在宅戦闘力が高まりなんだか良い気分です. さて,この連載では,自分の勉強・復習も兼ねて,ネットワークデータにまつわる統計解析を気の向くままに紹介しています. 前回の記事では,DeepWalkやnode2vecをはじめとするnode embeddingの手法を浅く広く紹介しました. 今回は,ネットワークデータに対する深層学習 (Gr…

【Dive into the Economics of Networks】vol.1 Introduction

… *1:弊社研究員の黒木が、「ネットワークの統計解析」というテーマで連載を行っています。そちらもご覧ください。 buildersbox.corp-sansan.com ネットワーク統計分析とネットワーク計量経済学の何が違うのかという話は、いずれできればと思っています。 *2:弊社研究員の前嶋のブログに、ホモフィリーの解説があります。 buildersbox.corp-sansan.com buildersbox.corp-sansan.com *3:https://sites…

距離の観点からノードの分散表現を俯瞰する

…、DSOC 研究員 黒木による記事 で説明されています。 本記事で分析対象とするアルゴリズムは以下の通りです。DeepWalk DeepWalk*6 はシンプルなノードの分散表現の学習アルゴリズムです。各ノードを始点としてグラフ上でランダムウォークを行い、得られたノードの系列を入力とした Skip-gram モデルでノードの分散表現を学習します。ランダムウォークを行うため、離れた位置のノードペアに対しても類似性を仮定しやすいのが特徴です。node2vec node2vec*7…

【ネットワークの統計解析】第4回 代表的なネットワークのモデルを俯瞰する (2)

…SOC 研究開発部の黒木裕鷹です. 8月下旬からはじめたこの連載も,はやいもので第4回となりました. 結構な文量をそこそこのペースで書いているような気もしますが,仕事もちゃんとしているつもりです(笑) さて,この連載では,自分の勉強・復習も兼ねて,ネットワークデータにまつわる統計解析を気の向くままに紹介しています. 前回の記事では,特に複雑ネットワークを中心として,1980から2000年代に盛んに開発されてきた手法を紹介しました. 今回からはいよいよ,ネットワークデータに対す…

【ネットワークの統計解析】第3回 代表的なネットワークのモデルを俯瞰する (1)

…SOC 研究開発部の黒木裕鷹です. 10月にゼルダの伝説 Breath of the Wild を購入し毎日2~30分ほどプレイしているのですが,寄り道ばかりしてしまい,まったくクリアできる気配がありません笑 さて,この連載では,自分の勉強・復習も兼ねて,ネットワークデータにまつわる統計解析を気の向くままに紹介しています. 第1, 2回は,ネットワークデータの標本調査(サンプリング)を扱いましたが, 今回からはいよいよ数理モデルを取りあげていきます. とはいえ,一概にネットワ…

【ネットワークの統計解析】第2回 ネットワークデータと標本調査(2)

…,DSOC 研究員の黒木裕鷹です. 今年の4月に新卒として入社しましたが,あっという間に半年経ってしまいました. 新しい環境にも慣れてきたのですが,同時に時間の速さに焦っています. この連載では,私の学習や復習もかねて,ネットワーク構造を持ったデータ(グラフデータ)を対象とした統計解析を紹介しています. 第2回のテーマも前回に引き続き,ネットワークデータの標本調査です. 第1回で扱った,単純なノードやエッジの無作為抽出に加えて,第2回では少し凝った標本抽出を2つ紹介します. …

【ネットワークの統計解析】第1回 ネットワークデータと標本調査(1)

…SOC 研究開発部の黒木です.今年の春に新卒社員として入社しました. 専門は統計解析で,特に時系列データやネットワークデータの分析を行ってきました.最近では,タイピングゲーム「寿司打」のやりすぎで左手中指の第2関節が少し痛みます. こちらの連載では,自分の勉強・復習も兼ねて,古典的な手法からより発展的な話題まで,ネットワークデータにまつわる統計解析を紹介していこうと思います. ネットワークとは,主体となるノード,それらのつながりであるエッジから構成される対象で,webページの…

© Sansan, Inc.