Sansan Tech Blog

Sansanのものづくりを支えるメンバーの技術やデザイン、プロダクトマネジメントの情報を発信

CRFのパラメータ学習を数式的に理解する

はじめに 本記事は、Sansan Advent Calendar 2023の6日目の記事です。 こんにちは、研究開発部の齋藤です。 固有表現認識にCRFを試す場面が最近あり、CRFのパラメータ学習を少し勉強しました。折角なのでまとめておこうかと思います。 書籍『形態素解析の理…

spaCyを用いて日本語の固有表現抽出(NER)モデルを学習する

はじめに 最近、固有表現抽出(Named Entity Recognition: NER)の学習をspaCyを用いて行う機会があったため、そのやり方について簡単にまとめたいと思います。

2023年度人工知能学会に参加しました

こんにちは、研究開発部の齋藤慎一朗です。 熊本で行われた2023年度 人工知能学会全国大会 (第37回)において、企業ブースの出展、インダストリアルセッションの発表を行いました。 本ブログでは、その様子について紹介させて頂きます。

アクセスに基づいた推薦のために、文書のどのような情報を使うべきか(その1)

3行で アクセスに基づいた推薦のために、文書のどのような情報を使うべきか考えた。 ニュースの中の名詞、固有名詞、名詞×ジャンル、固有名詞×ジャンルの4つに分けて推薦を行い、ユーザーが興味を持ちそうなニュースを推薦できているかを定性的に確認した。…

自分のTweetを使ってSentencepieceとMeCabの分かち書きの比較を行う

3行で はじめに Sentencepieceとは subwordとは Sentencepieceでの取り組み SentencepieceとMeCabの比較 利用するデータセット 利用したコード 適当なTweetを分かち書きしてみる Tweet全部を分かち書きし、頻度順に並べてみる まとめ 注釈 3行で Sentencepie…

「分析コンペ勉強会」を開催しました

こんにちは、Sansan DSOC 研究開発員の齋藤(@sinchir0)です。 3/2(火) 19:00 -21:00にて分析コンペ勉強会を開催させて頂きました。 sansan.connpass.com 今回は本勉強会のレポートを書かせて頂きます!

分析コンペ挑戦記: Cassava編

初めまして、Sansan DSOC 研究開発部の齋藤慎一朗と申します。(Twitterではsinchir0と名乗っています。) 分析コンペに参加するのが趣味なので、挑戦した内容と結果を定期的にブログで投稿していければと思い、執筆させてもらっています。 今回は、Cassava…

© Sansan, Inc.