Sansan Builders Box

Sansanのものづくりを支える技術やデザイン、プロダクトマネジメントの情報を発信

【Techの道も一歩から】第22回「AWS SageMakerで任意のコンテナをデプロイする」

f:id:kanjirz50:20190104142720j:plain

こんにちは。 DSOC R&D グループの高橋寛治です。

最近は、R&DのD側に興味が寄っており、本連載では pytest や WebAPI化といった話が多くなってきました。

さて、つい先日に Amazon Web Services(AWS) が提供するマネージド型の機械学習サービスの一部機能を使って、機械学習を用いた任意のコンテナを推論エンドポイントとしてデプロイしました。

SageMakerのお作法さえ理解すれば便利なものだと感じたため、SageMakerの概略および任意のコンテナのデプロイ方法について紹介します。

続きを読む

【Geek Seek Toolsで買われた、気になるモノ達】第8回「Lepow 15.6インチ フル HD ディスプレイ (モバイルディスプレイ) 」

f:id:hartmann3555:20191008165159j:plain

はじめに

こんにちは。DSOC Data Direction Group でデータエンジニアをしている千葉祐大です。

前回紹介したオープンエアーイヤホンですが、有線バージョンを自分でも購入しました。
主に自宅のリビングで作業をするときに利用していますが、家族との一定の関係性を保ちながら音楽等を聴けるのでかなり良い感じです。

さて、この記事は弊社の社内制度である Geek Seek Tools *1で購入されたガジェットの中から、僕がイケてると感じたものを気の赴くままに紹介していく連載となっています。

今回は弊社の在宅勤務制度であるイエーイでの利用を想定して15インチのモバイルディスプレイを本制度で購入した、DSOC Data Direction Group の有山涼さんにお話を伺いました。

f:id:hartmann3555:20191008165357j:plain
バッテリーを内蔵していないので全体的に薄く、軽い。

*1:生産性向上に資するガジェット・デバイスその他が購入しやすくなる制度。Geek Seek Tools の詳しい説明については第1回をご覧ください。

続きを読む

【ML Tech RPT. 】第10回 機械学習のモデルの評価方法 (Evaluation Metrics) を学ぶ (1)

f:id:ssatsuki040508:20181210005017p:plain
DSOC研究員の吉村です. 先日, 会社の同僚らと御岳山に登山へ行きました. 私は普段から登山に行く趣味があるわけではないので, 不安を抱えつつ山に向かったのですが, 案外何事もなく無事に帰ってこれました. (山への移動の電車の中で, 話し込みすぎて降りる駅とは別の駅まで来てしまうというプチアクシデントはありました.)

さて, 今回からは「機械学習のモデルの評価方法を学ぶ」というタイトルで記事を書いていこうかと思います. 以後, 本記事ではモデルという言葉を機械学習のモデルという意味で用います. 今回このテーマについて記述しようと思ったのは, 実際に業務で機械学習に基づく処理を本サービスに載せるかどうかの判断をする際に、どのような評価方法による評価が適切な判断材料になるのかについて毎回悩むためです. そこで, 今回からの数回は特に各種問題設定で用いられる評価指標について, それらを用いることでどのような判断ができるのか考察していこうと思います. なお, 今回からの記事では暗黙の上で「教師あり学習」を仮定しています. ただ, 一部「教師なし学習」の評価についても書く予定ですので, その場合は教師なし学習についてである旨を明記します.

続きを読む

Unite Tokyo 2019 に登壇しました

はじめまして、プロダクト開発部の西根です。

執事喫茶の執事から転職したゆるふわ系のエンジニアです。 好きな言語はC#で趣味はゲーム作りと紅茶です。 日本紅茶協会認定ティーアドバイザーですので紅茶のことならなんでも聞いてください。

さて、今回はプライベートな活動として Unite Tokyo 2019 で Microsoft の方と共同でセッションを行いましたので、そちらについてブログを書いてみようと思います。

特にオチは無いので Sansan のエンジニアにはこんな人もいるんだなーとゆるく読んでいただければ幸いです。

続きを読む

「After iOSDC」参加レポート

初めまして!
4月より Sansan に iOS アプリエンジニアとして入社しました髙橋と申します。

先日行われた iOSDC Japan 2019 をテーマに、ZOZOテクノロジーズさん、JapanTaxiさん、Sansan の3社合同で開催した勉強会「After iOSDC」に参加したので、イベントの様子をお伝えしたいと思います。

zozotech-inc.connpass.com

続きを読む

【Intern CV Report】Contextual Lossについて学ぶ

f:id:S_aiueo321:20190404193803p:plain

こんにちは,DSOC R&Dグループ インターン生の内田です. 最近巷でキーボードが話題になっているのに触発されて,ついHHKBを購入してしまいました. ものすごく快適である一方,出先で手が痛くなる問題に悩まされる今日このごろです.

はじめに

弊社で取り扱う名刺画像の入り口には主にスキャナとカメラの2つが存在しており,画像品質はどうしても スキャナ > カメラ となります. 現在カメラ画像に対してHand-Craftedな手法で影の除去や輝度値の引き上げなどを行っています. これを機械学習ベースの手法へ置き換えたいと考えたとき,品質の高いスキャナ画像を正解として学習したいという願望が出てきます.

カメラ画像とスキャナ画像のペア画像データセットを作成する場合,カメラ画像とスキャナ画像の位置合わせが必要となります. 安直には,キーポイントマッチング・ロバスト推定・射影変換を用いて位置を合わせる方法などが考えられます. しかし実際のところ,カメラ画像にはブレやピンボケなどの歪みがあり,写っている名刺が物理的に折れ曲がっていたりもするため,厳密に位置を合わせることはかなり難しいです*1. 位置合わせを頑張るのを半ば諦めて「位置が合ってない状況で学習できないかな~」と考えていた矢先,以前の連載に登場したContextual Bilateral Loss (CoBi)[*2]を思い出しました. CoBiは焦点距離の変化による位置ずれを考慮した誤差関数であり,やりたいこととマッチしている感じがします.

そんなわけで今回は,CoBiの派生元であるContextual Loss[*3][*4]について勉強がてらにまとめたいと思います.

*1:それだけ1つの研究対象になり得ます.

*2:Zhang, Xuaner, et al. "Zoom to Learn, Learn to Zoom." Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2019.

*3:Mechrez, Roey, Itamar Talmi, and Lihi Zelnik-Manor. "The contextual loss for image transformation with non-aligned data." Proceedings of the European Conference on Computer Vision (ECCV). 2018.

*4:Mechrez, Roey, et al. "Maintaining natural image statistics with the contextual loss." Asian Conference on Computer Vision. Springer, Cham, 2018.

続きを読む

© Sansan, Inc.