https://prtimes.jp/main/html/rd/p/000002450.000000496.html
おぉ、部活動! フェアプレーでいきましょう!
https://prtimes.jp/main/html/rd/p/000002450.000000496.html
おぉ、部活動! フェアプレーでいきましょう!
(参考:Genmo | Open Video Generation)
(参考:genmo/mochi-1-preview · Hugging Face)
オープンソースでもクオリティが高い画像生成ツールが出てきた。
ただしでもはH100を4枚使ってるとのこと、なかなか試すのは難しそうだ。
(参考:【OmniParser】全デバイスのUIを正確に分析できるMicrosoft製AIツール! | WEEL)
(参考:https://github.com/microsoft/OmniParser?tab=readme-ov-file)
(参考:https://arxiv.org/pdf/2408.00203)
画面認識のモデル、細かく読めているようには見えます。
実際には、枠で囲んだところをテキスト化しているようで、少し得意な画面・不得意な画面はあるような感じです。
金属アレルギー、ね。なるほど、そういう視点もあるのね。
https://eetimes.itmedia.co.jp/ee/articles/2409/30/news123.html
ラズパイの目も進化中のようです。
人体が一番汚れている気がしてきた。。。
9/24 未来環境ラボ主催で「物体認識ワークショップ」を行いました。実際に混雑状況の検地をおこなってみたチームがいたり、面白いワークショップになりました。
KCGI ホームページ:https://www.kcg.edu/news/2024/09-26