(参考:【OmniParser】全デバイスのUIを正確に分析できるMicrosoft製AIツール! | WEEL)
(参考:https://github.com/microsoft/OmniParser?tab=readme-ov-file)
(参考:https://arxiv.org/pdf/2408.00203)
画面認識のモデル、細かく読めているようには見えます。
実際には、枠で囲んだところをテキスト化しているようで、少し得意な画面・不得意な画面はあるような感じです。
(参考:【OmniParser】全デバイスのUIを正確に分析できるMicrosoft製AIツール! | WEEL)
(参考:https://github.com/microsoft/OmniParser?tab=readme-ov-file)
(参考:https://arxiv.org/pdf/2408.00203)
画面認識のモデル、細かく読めているようには見えます。
実際には、枠で囲んだところをテキスト化しているようで、少し得意な画面・不得意な画面はあるような感じです。