Sansan Tech Blog

Sansanのものづくりを支えるメンバーの技術やデザイン、プロダクトマネジメントの情報を発信

ディープラーニング

自社OCRエンジン「NineOCR」の学習効率化のため SageMaker Training を導入した話

はじめに NineOCR とは NineOCR が抱える課題 Amazon SageMaker Training とは SageMaker Training の始め方 事前準備 AWS が提供しているコンテナイメージを拡張する方法 独自のコンテナイメージに SageMaker Training Toolkit をインストールする方法 スク…

歴史をたどってディープラーニングを学ぶ 第十九回 GPGPU入門 CUDAによる画像フィルタ編

こんにちはニューラルネット老人こと糟谷勇児です。 このようなブログをやっていてなんですが、私自身はほとんどディープラーニングを実務で使っていません。 ディープラーニングがはまるということは、学習データが豊富で、説明力はある程度弱くてもよく、G…

歴史をたどってディープラーニングを学ぶ 第十八回 GPGPUを学ぶCUDA入門編

こんにちは、ニューラルネット老人こと糟谷勇児です。最近はメルカリでアンモナイトが入っている(かもしれない)北海道の石を買って化石発掘を子どもと一緒にやっています。 売っているアンモナイト化石はどれも立派なんですが、実際自分で掘ってみると1mm…

自分のTweetを使ってSentencepieceとMeCabの分かち書きの比較を行う

3行で はじめに Sentencepieceとは subwordとは Sentencepieceでの取り組み SentencepieceとMeCabの比較 利用するデータセット 利用したコード 適当なTweetを分かち書きしてみる Tweet全部を分かち書きし、頻度順に並べてみる まとめ 注釈 3行で Sentencepie…

歴史をたどってディープラーニングを学ぶ 第十七回 GPGPUを学ぶ準備編

こんにちは、ニューラルネット老人こと糟谷勇児です。以前化石集めが趣味という話を書きましたが、最近はコロナのせいかあまり新しい化石が流通せず、ちょっと退屈です。 そこでフローライトやラブラドライトなどのいわゆる天然石を集めています。それはそう…

歴史をたどってディープラーニングを学ぶ 第十六回 これまでのまとめと、なぜ私はディープラーニングをつくれなかったか

こんにちは、ニューラルネット老人こと糟谷勇児です。Sansanに入社して5年が過ぎました。そういえば前職にいたときに隣の部署のマネージャーとこんな会話をしたことがありました。 「なんで学生時代(2004年当時)にニューラルネットの研究をしていたのに、私…

歴史をたどってディープラーニングを学ぶ 第十五回 VGGにも使える高速化したコンボリューショナルネットのコードをGitHubで公開する

こんにちは、ニューラルネット老人こと糟谷勇児です。 在宅勤務になって通勤時間が減り、このブログにさける時間が増えるかと思いきや、 朝は子供を40分かけて幼稚園に送っていき、夜は子供を寝かしつけるのでニューラルネットをやる時間が激減しました。と…

分析コンペ挑戦記: Cassava編

初めまして、Sansan DSOC 研究開発部の齋藤慎一朗と申します。(Twitterではsinchir0と名乗っています。) 分析コンペに参加するのが趣味なので、挑戦した内容と結果を定期的にブログで投稿していければと思い、執筆させてもらっています。 今回は、Cassava…

歴史をたどってディープラーニングを学ぶ第十四回 C#で書かれたシンプルなコンボリューショナルネット(CNN)のコードをGitHubで公開してみる

こんにちは、ニューラルネット老人こと糟谷勇児です。前回はパーセプトロンのコードを紹介しました。 まあパーセプトロンは誰でもかけるし、ここからが本番。CNNのコードをアップしていきます。

歴史をたどってディープラーニングを学ぶ第十三回 コードをGitHubで公開してみる。パーセプトロン編

こんにちは、ニューラルネット老人こと糟谷勇児です。 今回はニューラルネット老人というよりGitHub老人というところでしょうか。というわけで今回はGitHubでニューラルネットのコードを公開していきます。C#でディープラーニングをしているプロジェクトって…

歴史をたどってディープラーニングを学ぶ第十二回 Global Average Poolingでついにパーセプトロンの面影をすべて失ったディープラーニングを学ぶ

こんにちは、ニューラルネット老人こと糟谷勇児です。今回はGlobal Average Poolingを学んでいきます。 Global Average Pooling層を入れると全結合層が要らないらしいぞと聞いて、思いは複雑です。 というのも、私が学生の頃に学んだバックプロパゲーション…

歴史をたどってディープラーニングを学ぶ 第十一回 VGGをC#で実装して学ぶ

こんにちは、ニューラルネット老人こと糟谷勇児です。 今回はVGGを自作して学ぼうと思います。しかし、ニューラルネットガチ勢からすると、ディープラーニングのフレームワークでいいですし、ゆるふわ勢もフレームワークでいいので、自作はどういう層に響く…

歴史をたどってディープラーニングを学ぶ 第十回 AlexNetをデータオーギュメンテーションさせて学習させる。さらに高速化もしたよ

こんにちはニューラルネット老人こと糟谷勇児です。 2012年の技術に追いついたので現在は9年差、犬の年齢に例えると52歳ぐらいなので、そろそろ老人を脱却できるかもしれません。 www.ipet-ins.com今回はAlexNetをもう少し深堀りしつつ、今後の予定を考えて…

© Sansan, Inc.