https://www.itmedia.co.jp/news/articles/2409/11/news069.html
隠し事はなにもありませんよ。
https://www.itmedia.co.jp/news/articles/2409/11/news069.html
隠し事はなにもありませんよ。
テキストや画像、動画から動画を生成するオープンソース版も新しいものが出てきている、高精細化にも使えそう、
前の話題に重ねますが、以前 サグラダ・ファミリアに行ったとき、今世紀完成しないだろうと言われていた工事の終了が見えてきたのは3Dプリンター技術だとおっしゃってました。(完成しないほうが良かったのでしょうか、、、)
参考:https://go.orixrentec.jp/rentecinsight/3dprinter/article-34
なんでも自分で作れちゃいますね。安全基準、あるのかな?
https://gigazine.net/news/20240928-ai-making-workers-less-productive
どうするといいか、AIに聞いてみては?
https://prtimes.jp/main/html/rd/p/000002450.000000496.html
おぉ、部活動! フェアプレーでいきましょう!
(参考:Genmo | Open Video Generation)
(参考:genmo/mochi-1-preview · Hugging Face)
オープンソースでもクオリティが高い画像生成ツールが出てきた。
ただしでもはH100を4枚使ってるとのこと、なかなか試すのは難しそうだ。
(参考:【OmniParser】全デバイスのUIを正確に分析できるMicrosoft製AIツール! | WEEL)
(参考:https://github.com/microsoft/OmniParser?tab=readme-ov-file)
(参考:https://arxiv.org/pdf/2408.00203)
画面認識のモデル、細かく読めているようには見えます。
実際には、枠で囲んだところをテキスト化しているようで、少し得意な画面・不得意な画面はあるような感じです。