テキストや画像、動画から動画を生成するオープンソース版も新しいものが出てきている、高精細化にも使えそう、
投稿者: じん
【トピックス】サグラダ・ファミリア建設に貢献する3Dプリンターと3DCADの技術
前の話題に重ねますが、以前 サグラダ・ファミリアに行ったとき、今世紀完成しないだろうと言われていた工事の終了が見えてきたのは3Dプリンター技術だとおっしゃってました。(完成しないほうが良かったのでしょうか、、、)
参考:https://go.orixrentec.jp/rentecinsight/3dprinter/article-34
[11/15(金)18:30~ ] 未来環境ラボゼミ
少し間が空いてしましましたが、11/15(金)、2024年度第7回のオンラインゼミやります!秋学期が始まって1ヶ月、気温もだいぶ下がってきました。最近のAI技術や社会の動向や気になるアニメなど、気軽にディスカッションしましょう!
- 日時: 11/15(金) 18:30〜21:00 (途中参加・退出OK)
- テーマ
- 検討中
- 会場
- Presence (Chrome推奨。ビデオ→マイクの順でonにしてください)
- Zoom(予備):
※詳細はメンバーSLACKにて
- 適当にオンライン飲み会に移行します。参加できる人は各自飲み物や食べ物を準備してください。
【トピックス】オープンソースの画像生成ツールの精度が上がってきた。
(参考:Genmo | Open Video Generation)
(参考:genmo/mochi-1-preview · Hugging Face)
オープンソースでもクオリティが高い画像生成ツールが出てきた。
ただしでもはH100を4枚使ってるとのこと、なかなか試すのは難しそうだ。
【トピックス】画面の状況をAIでテキスト化してくれるOmniParser
(参考:【OmniParser】全デバイスのUIを正確に分析できるMicrosoft製AIツール! | WEEL)
(参考:https://github.com/microsoft/OmniParser?tab=readme-ov-file)
(参考:https://arxiv.org/pdf/2408.00203)
画面認識のモデル、細かく読めているようには見えます。
実際には、枠で囲んだところをテキスト化しているようで、少し得意な画面・不得意な画面はあるような感じです。
[10/4(金)18:30‐]未来環境ラボゼミ
(10/4)、2024年度第6回のオンラインゼミやります!秋学期が始まり、今年も残すところあと3ヶ月になりました。秋学期の豊富や最近のAI技術についてなど、ディスカッションしたいことがあれば、是非エントリーしてください!
- 日時: 10/4(金) 18:30〜21:00 (途中参加・退出OK)
- テーマ
- 物体認識ワークショップ振り返り(中口)
- サンプルコードも解説するかも
- 物体認識ワークショップ振り返り(中口)
- 適当にオンライン飲み会に移行します。参加できる人は各自飲み物や食べ物を準備してください。
「物体認識ワークショップ」開催,社会の実課題の解決に取り組みました
9/24 未来環境ラボ主催で「物体認識ワークショップ」を行いました。実際に混雑状況の検地をおこなってみたチームがいたり、面白いワークショップになりました。
KCGI ホームページ:https://www.kcg.edu/news/2024/09-26
【トピックス】生成AIを使った動画作成の精度が上がってきた。
GoogleのImageFxとRunway Gen3を組み合わせてみました。どちらもGoogleアカウントがあれば無料で使えます。背景のぼかしとかうまく使えたり、人物破綻が少なくなったり精度は上がっているようです。
【トピックス】画像生成で使われる PythonのライブラリのFLUX.1 がかなり機能が高い。
参考:https://pc.watch.impress.co.jp/docs/column/nishikawa/1616924.html
Stable Diffusion からのスピンアウト。
やってみた、かなりリアルな生成ができた(看板の文字もきれい)
動画の生成も(短ければ)できる、動画は短いものしかできず、質はいまいちだった。
とはいえ、このライブラリがいろいろなものを吸収して成長している状態のようだ。
[8/9(金)18:30‐]未来環境ラボゼミ
(8/9)、2024年度第5回のオンラインゼミやります!春学期お疲れ様でした。夏本番に入り、蒸し暑い日が続きますが、体調に気をつけつつ頑張りましょう。紹介したいことやディスカッションしたいことがあれば、是非エントリーしてください!
- 日時: 8/9(金) 18:30〜21:00 (途中参加・退出OK)
- テーマ
- 最新物体認識技術の動向(中口)
- 会場
- Presence (Chrome推奨。ビデオ→マイクの順でonにしてください)
- https://fungo.kcg.edu/presence/futurelab-semi-2394hsk/
- Zoom(予備):
- https://zoom.us/j/9971962049?pwd=cU1aeXJ5YThma09xRWR6enB3WXE4UT09
- 適当にオンライン飲み会に移行します。参加できる人は各自飲み物や食べ物を準備してください。