Sansan Tech Blog

Sansanのものづくりを支えるメンバーの技術やデザイン、プロダクトマネジメントの情報を発信

自分のTweetを使ってSentencepieceとMeCabの分かち書きの比較を行う

  • 3行で
  • はじめに
  • Sentencepieceとは
    • subwordとは
    • Sentencepieceでの取り組み
  • SentencepieceとMeCabの比較
    • 利用するデータセット
    • 利用したコード
    • 適当なTweetを分かち書きしてみる
    • Tweet全部を分かち書きし、頻度順に並べてみる
  • まとめ
  • 注釈

3行で

  • Sentencepieceの論文概要を説明した。
  • 自身のTweetを用いて、SentencepieceとMeCabの分割点の違いを調べた。
  • Sentencepieceでは生文から生成された特徴的な分割が見られた。一方、今回のような少ない学習データでは上手く分割できない。
続きを読む

非エンジニアがAWS認定クラウドプラクティショナーに挑戦してみた!

こんにちは。プロダクト戦略開発室 技術ブランディンググループの相場です。普段はCTO直下のチームで自社イベントの企画や技術イベントへの協賛、当ブログの運営などを担当しています。
エンジニア経験のない私が先日AWS認定クラウドプラクティショナーを取得したので、今回はその過程をご紹介したいと思います。
www.credly.com

続きを読む

Sansan Technical View に参加してきました

こんにちは。 Sansan 事業部プロダクト開発部で iOS アプリエンジニアをしている中川です。 今回は 5/25 に開催された Sansan Technical View に参加してきたので、それぞれの発表についてまとめてみました。参加されていない方へとっかかりになればと思います。

sansan.connpass.com

続きを読む

Jamf Connect の導入について(前編)

こんにちは。コーポレートシステム部の寺園です。
モットーは「楽するための努力は惜しまない」です。

さて、だいぶ期間が空いてしまいましたが 以前書いたブログ で少し触れていた Jamf Connect について正式導入する運びとなったので、使ってみないと分からない Jamf Connect のあれこれをご紹介させていただこうと思います。*1

*1:本記事で紹介している Jamf Connect の機能はバージョン2.3.3を元にしています

続きを読む

UXリサーチセンターを発足しました

こんにちは。UXリサーチセンターの林です。

プレスリリースを発表しましたが、昨年からの準備期間を経て、6月よりプロダクト横断でUXリサーチを行う組織を立ち上げました。BtoBプロダクトを主軸とする企業でUXリサーチ専門の組織を持つのは比較的珍しいかと思いますので、どんな経緯でどんな特徴を持った組織を立ち上げたのかご紹介したいと思います。

続きを読む

人事異動のデータ化の取り組み 〜 CamelotによるPDFの表データ抽出

DSOC サービス開発部 GEES/JES/COEグループの松本です。

最近はコロナの影響で巣ごもりをしており、家の庭で芝生を育てています。
色々と手抜きをしてしまったがために生え揃いがまばらで、かわいい反面、芝生の上を裸足で歩けるようになるにはまだまだ時間がかかりそうです。気長に待ってみようと思います。

今日はSansanの機能の一つである、人事異動ニュースを支えるデータ化の取り組みについてご紹介したいと思います。

続きを読む

バーチャル背景プロジェクトを通して、オンラインでいかに「楽しい」体験を作るか考えてみた

はじめまして。
昼はデザイナー、夜は2歳半の子供の母をしてるEight事業部の河西です。

なかなかデザイナーの頭の中をお伝えする機会はないのですが、せっかくですので最近私の中でテーマとなっている、オンラインでいかに「楽しい」体験を作るか?についてお話しさせて頂きます。

続きを読む

© Sansan, Inc.