AI 化社会

AI についてのブログ

本日中に GPT 5.2 が公開されるかも?!

本日中に GPT 5.2 が公開されるかも知れないとのこと。

[https://x.com/ctgptlb/status/1998252166449135801](https://x.com/ctgptlb/status/1998252166449135801)

ただ、個人的にはまったく期待していない。
速度向上 20 から 30% がうりなのかも知れないが、すでに十分早い。
信頼 ...

AI 生成塗りつぶしを公開

AI 生成塗りつぶしを公開した。

[https://www.ikachi.org/inpaint/](https://www.ikachi.org/inpaint/)

このプログラムは、既存の写真や画像から、変更したい部分をブラシで塗りつぶし、塗りつぶした箇所をどのように変更してほしいかを指示することで、既存の写真や画像を思い通りに修正するサービスである。

以前も公開していたが、 ...

AI 美人度診断を公開

昨日に引き続き、今度は「AI 美人度診断」を公開。

[https://www.ikachi.org/facescore/](https://www.ikachi.org/facescore/)

これも、Face++ は使っておらず、自宅のサーバに HuggingFace に公開されている顔認識モデルを使用した。
詳しくは、以下のとおり。

モデル: SqueezeNetベース N ...

AI 顔交換と AI 顔修復を公開

12 月から Face++ の API が使えなくなり、いくつかの顔認識サービスの公開を停止した。

そこで、顔認識サービスはすべて自作する必要がでてきた。

顔面偏差値診断と顔年齢診断については、face-api.js という JavaScript のライブラリで代替することができた。
Face++ よりも精度は落ちるものの、クライアント側で動作するため、顔写真をアップロードしてもらう ...

PDF 読み取り性能が高い AI はどれ?

**OpenAI** の API、**Gemini** の API、Anthropic の API にて、それぞれ解像度の低い PDF の読み取り精度を調査した。

結果、Gemini の API がダントツだった。

OpenAI の方は最新モデルの最上モデルでもまったくダメ、Anthropic は最新モデルの最上モデルなら OK だがあとは全滅、その点、Gemini なら多少安価なモデ ...