プラモからアプリまでなんでも作る！

プラモからアプリまでなんでも作る！

ホームピグアメブロ

芸能人ブログ人気ブログ

20Jun
- アップスケールの精度を底上げしたい！
  今のアップスケーリングアプリはこんな感じですここかアップスケーリングをオブジェクトごとに設定を変える自動マスク機能をつけたいと思います。それを具体的に指示ててimplementation_planを作成してもらいました。AIマスク生成機能実装計画書 (Implementation Plan)本計画書は、アップスケーリングアプリケーションに「AIマスク生成（AI Mask）」タブを新設し、画像内の要素（人物・顔・背景など）をAIで解析・セグメンテーションしてマスクを生成する機能を実装するための計画である。ユーザー確認が必要な事項 [!IMPORTANT] UI全体のタブ化: 現在の「1画面構成」から、ウィンドウ最上部に「アップスケール」と「AIマスク生成」を切り替えるタブコントロール (ctk.CTkTabview) を導入する構成へUIを変更します。これに伴い、既存のアップスケーリング機能のレイアウトは「アップスケール」タブ内に移植されます。セグメンテーションモデル: 初期実装では models/selfie_segmenter.tflite (人物・背景抽出) および models/blaze_face_full_range.tflite (顔検出) を使用したモデル推論を実装します。空、テキスト、その他のオブジェクトについては、簡易的なダミー/色相/矩形抽出または将来拡張用のプレースホルダーとして定義します。オープン質問 [!NOTE] 解析後のマスクデータを、将来的に「アップスケーリング実行時」の領域別パラメータ適用（人物だけ高精細化、背景はデノイズのみ等）へどのように引き渡すか、内部データ構造の設計についてフィードバックを歓迎します。提案される変更点1. UIのタブ化とAIマスク生成タブの実装メインウィンドウ全体を ctk.CTkTabview を使用したタブ構成へ変更。- タブ1: アップスケール (既存のレイアウトをそのまま配置)- タブ2: AIマスク生成 (新規追加) AIマスク生成タブ内に以下のレイアウトを構築する。- 左ペイン: 解析パラメータ & マスクレイヤー一覧パネル- 解析パラメータ: GPUデバイス選択 (CUDAデバイスリスト)、検出感度スライダー、および「解析開始」ボタン。- マスクレイヤー一覧: 各種カテゴリ (人物、顔、オブジェクト、テキスト、空、背景) のチェックボックス、信頼度スコア表示。- 右ペイン: 画像プレビューエリア (マスクの半透明色分けオーバーレイ表示用キャンバス) 非同期処理: 解析処理を別スレッド (threading.Thread) で実行し、解析中はプログレスバーをアニメーションさせてUIがフリーズしないようにする。2. マスク生成推論エンジンの実装[NEW] [ai_mask_engine.py](file:///h:/My%20Apps/upscaler%20ex/ai_mask_engine.py) AIマスク生成用のエンジンクラス AIMaskEngine を新規実装。 MediaPipe / TFLite を用いた selfie_segmenter による人物・背景のセグメンテーション。 blaze_face (または OpenCV の顔検出器) による顔領域マスクの抽出。信頼度（confidence threshold）に基づくマスク領域のフィルタリング。生成した各マスク（2値の NumPy 配列）を画像（PIL.Image または NumPy）として保持し、UI側のオーバーレイ表示用に合成する関数を提供。検証計画1. ユニットテスト / 手動検証アプリケーションを起動し、UI全体がエラーなく描画され、タブ切り替えがスムーズに行えることを確認。画像をドラッグ＆ドロップまたは「ファイルを開く」で読み込み、「AIマスク生成」タブで「解析開始」を実行した際に、人物や背景のマスクが検出され、半透明のオーバーレイが正しくプレビューに描画されることを確認。各レイヤーのチェックボックスをON/OFFした際、オーバーレイ表示がリアルタイムに更新されることを確認。検出感度スライダーを変更したときに、しきい値処理が正常に反映されることを確認。普通の人が見ても、ちゃんと理解するのは難しいですが、大丈夫です！私もわからない部分が多いですから！ではこのプランを承認して実装してもらいましょう。なんやかんや５分くらい待ちまして完成したのがこちら画面ではちゃんとタブが追加されていてアップスケールとAIマスク生成ができてます！あとはちゃんとAIマスク生成できれば文句なしですね！まぁいつも１回ではうまくいかないですが・・毎度なんですがドラッグ＆ドロップ(以下D&D)でファイル読み込む機能を忘れてしまってます・・・ってファイルを開くところないじゃん！って思ったら、アップスケールのところでD&Dでいけました (汗)画像なんてどんなのでもいいんですが、あえてネットで拾ってきた失敗しそうなのをポイっとしました。各設定はとりあえず初期値で解析開始ーっと一瞬で終わったんですが、案の定GPUはほとんど使われてないし、マスクもイビツ・・・ずっと気になってた使用デバイスっていうのが空欄なのも気になったので、Antigravityに聞いてみることにと、ご返事。確認してみますか顔も人物すら検出されとらんぞ！そんな時はAntigravityに解析に出した画像をそのまま見てもらって原因を特定してもらうのがいいです！ai_mask_engine.py 内で、人物マスクが取れなかった場合に顔マスクが消去されてしまうフィルタリングの制限（論理積）を取り除きました。これにより、今回のような遠景で人物全体が小さく映る写真であっても、個々の顔を「顔（Face）」レイヤーとして独立して正しくマスクできるようになりました。使用時のコツ（アドバイス）写真のメンバー一人一人の顔が非常に小さいため、もし一部の顔が検出されない場合は、UIの「検出感度（閾値）」スライダーを少し下げて（例: 0.30 〜 0.40 付近）から、再度「⚡ AIマスク解析を開始」ボタンを押してみてください。これにより、より高い確率で全員の顔が検出されるようになります。とのことなので感度を下げて再度挑戦！やっぱり検出されない！なので AIのモデルをLowからHighに変えて再度指示！修正内容1. 全身・遠景人物モデルの採用: 人物判定エンジンを自撮り用（`model_selection=0`）から、今回の画像のような離れた位置の全身像・複数人に対応したランドスケープモデル（`model_selection=1`）に切り替えました。2. 顔検出の信頼度しきい値緩和: 遠景画像では顔の一つ一つが小さくなり信頼度スコアが下がりやすいため、顔検出のしきい値を調整（感度スライダー設定値の80%）して、検出されやすくしました。3. 干渉制約の撤廃: 顔マスクが人物マスクからはみ出した際に消滅してしまう AND 制約（`cv2.bitwise_and`）を取り除き、顔検出器の検出結果が独立してそのままマスクとして反映されるようにしました。とのことで、ここからエラーが出まくるので出てきたエラーを一気にズラッとと、エラー確認はできるだけいいモデルを使った方がいいですよ・・・そのじゃないと無駄に同じようなことを繰り返しますから。いいのを使えば、なぜエラーが出たのかをちゃんと表示してくれるようにしてどう改善すればいいかを、手数を少なく済ませられます。とりあえず、人物と検出するようにはなりましたが、顔の見識には至らないですね。やっぱり試す画像が複雑過ぎたのかな・・・というか文字やテキストとして検出しすぎじゃないか・・・と、なんやかんややってたら、AIのトークンを使い切ったので終わりです次回、GPUのパワーをつかって何とかしようと思います。
14Jun
- Geminiのcanvasで美容院の予約管理アプリの基礎を作った
  知り合いにワンオペで美容院を回しているので予約の管理が楽になるように予約管理システムを個人開発してみた！最近、自分がよく通っている美容院のにいちゃんが少しでも楽に、かつスマートに管理できたらなぁとおもって「予約管理システム」を自作してみました。世の中には便利な予約サイトやアプリがたくさんありますが、自分の業務フローに完璧にフィットするものって、なかなか見つからないものですよね。「それなら、自分で作ってしまおう！」と思い立ち、今回開発したのがこのツールです。1. 「何を作るか」を決めるまずは、美容院にとって「絶対に外せない機能」を書き出しました。一目で1週間の予約がわかるカレンダー表示お客様の情報を素早く呼び出せる顧客マスタードラッグ＆ドロップで予約枠を直感的に変更できる操作性この「ドラッグ＆ドロップ」の挙動には特にこだわり、指（マウス）のどの位置を掴んでも、予約枠の上端を基準にスナップするように設計しました。これにより、小さなスマホ画面でもストレスなく操作できるようにしています。2. 技術的なこだわり（フロントエンド開発）今回、あえてフレームワークを過剰に導入せず、HTMLとReactのシンプルな構成を採用しました。開発していく中で一番苦労したのは「カレンダーのズレ」です。日付の計算でタイムゾーン（UTCとJST）の壁にぶつかり、1日ズレて表示されてしまうという個人開発あるあるのバグを経験しました。これを独自のヘルパー関数を作ることで、どんな時間帯でも正確に日付を表示できるように修正しました。また、個人開発だからこそできた「自分専用のUX改善」もポイントです。3. モバイル対応への挑戦当初はPCでの操作を想定していましたが、実際に使うとなると「スマホでもサッと確認したい」というシーンが必ず出てきます。そこで、画面幅が狭いスマホ表示の際には、自動的に「1日表示モード」に切り替わるレスポンシブ対応を行いました。画面上部のタブをタップするだけで、その日の予約が全幅で表示され、非常に快適に操作できるようになっています。4. 過去の予約を守る「守りの設計」予約管理において意外と重要なのが、「過去の予約の保護」です。一度終わった予約を間違ってドラッグで動かしてしまわないよう、過去の日時に関してはドラッグを無効化し、さらにその予約枠には「担当完了」や「キャンセル」というステータス管理機能を持たせました。これにより、データが綺麗な状態で残るようになっています。まとめ「自分のための道具」を作るのは、本当に楽しいですね。もし「こんな機能も欲しいな」というアイデアが浮かんだら、またすぐにコードを書き換えてアップデートしていける。これこそ個人開発の醍醐味だと思います。あくまでもこれは」Geminiのcanvasを使った基礎を設計しただけなので、本格的な機能の実装等はAntigravityで整えていこうとおもいます！
10Jun
- 背景がごちゃつくと顔の検出人数が増えてカオスになっちゃった
  【開発ブログ】顔検出精度と顔修復（GFPGAN）強度調整機能のバグ修正・改善本日実施したAI画像アップスケーラー（Upscaler EX）の機能改善およびバグ修正についてのまとめです。顔検出の安定化、目元の位置ずれ防止、そしてアップスケーリング完了後のリアルタイム修復強度（Fidelity）スライダーの不具合について大幅なアップデートを行いました。1. 顔検出精度の向上（誤検出の排除）課題1人しか映っていない画像であるにもかかわらず、背景や衣服のテクスチャ等を誤認して4人の顔が検出されてしまう問題が発生していました。画像をスクショするのを忘れてしまいました・・・。対策MediaPipeの顔検出モデルに対して、以下の多重フィルタリング処理を実装しました。信頼度（Confidence）の閾値引き上げ: 最小検出信頼度を 0.3 から 0.5 へ引き上げ、不確実な検出をカットしました。面積比率フィルタの導入: 画像全体の面積に対して一定割合（3%以上）を占める大きさのバウンディングボックスのみを検出対象とし、背景の極小ノイズを完全に除外しました。非最大値抑制（NMS）の追加: 検出された顔同士の重なり（IoU: Intersection over Union）を算出し、一定以上（30%以上）重複している場合は信頼度の低い方のバウンディングボックスを排除する処理を実装しました。これにより、誤検出が完全にゼロになり、本来の被写体のみを確実に捉えることができるようになりました。※ [IMG]（検出結果：誤検出が排除され、人物の顔のみを正しく囲んでいるバウンディングボックスの様子）2. 顔と瞳の位置ずれ防止（4点相似変換アライメント）課題AIによる顔修復を施した際、元画像と比べて目じりや目頭の位置（顔全体のパーツレイアウト）がわずかにずれてしまうことがありました。対策従来の左右の目のみに基づく2点基準アライメントに加え、「左右の目・鼻先・口」の計4点キーポイントを使用した相似変換（cv2.estimateAffinePartial2D）を導入しました。キーポイントの歪みをより広い面で最適化・フィッティングすることで、アップスケール貼り戻し時のパーツ位置のズレを最小限に抑え、元の顔立ちの印象を維持したまま高画質化できるようになりました。3. アップスケーリング完了後の修復強度（Fidelity）スライダー不具合の修正課題アップスケーリング後に顔修復の「修復強度」スライダーを操作してもプレビュー画像が正しくリアルタイムで変化しなかったり、一度スライダーを下げてから100%に戻した際に元の100% AI修復顔に戻らない（目元がボケたままになる）問題が発生していました。対策中間キャッシュを利用した高速再合成（recomposite）のロジックを見直し、以下の修正を行いました。 100%修復（Fidelity=1.0）時のブレンドバイパス処理の同期: 最初の実行時（restore_faces）と同様に、再合成処理（recomposite_faces）でも fidelity = 1.0 のときは目元のブレンド処理をスキップし、完全に復元されたAI出力画像をそのまま適用するよう修正しました。これにより、スライダーを100%に戻した際に、完全に修復された目元に戻るようになりました。顔修復有効化フラグの伝播: recomposite_image メソッドにチェックボックスのオン/オフ状態（face_restoration）を受け取る引数を追加しました。チェックが外れている場合は顔修復のブレンドを行わないようにすることで、チェックボックスをオフにした状態でシャープネススライダーを動かしたときに顔修復が勝手に再適用されてしまうバグを解決しました。チェックボックス操作時のリアルタイムプレビュー同期: チェックボックス（👤 人物の顔・瞳を自然に修復）のオン/オフを切り替えた際にも、スライダーを動かした時と同様に即座に再合成が走り、プレビュー画像が切り替わるようにメインUI側のイベントハンドラを更新しました。 4. 各プリセットにおけるノイズ除去・シャープネス強度の初期値調整対策実用的な画質結果に基づき、各画像タイプ（プリセット）のデフォルト強度を全体的に5%ずつ引き下げ、よりマイルドで自然な出力になるよう初期設定値を調整しました。今の状況で風景や物質はスケールアップではイラスト感が大いに増します。その改善には各強度の数値を少し小さくすれば違和感は減ると思います。生物（人物・動物）: ノイズ除去: 15% → 10% シャープネス: 20% → 15% 物質（建物・イラスト）: ノイズ除去: 10% → 5% シャープネス: 45% → 40% 風景（自然・街並み）: ノイズ除去: 25% → 20% シャープネス: 30% → 25% スケーリングアップ後にトリミング機能を搭載。ついでにファイルの保存場所を、ファイルが元あった場所にリネームして保存するか、指定されたフォルダに保存するか選べるようにしてみた。まとめ今回のアップデートにより、AIアップスケーリングの安定性が高まると同時に、アップスケーリング完了後の試行錯誤（スライダー調整）がノンストレスで行える非常に軽快なインタラクティブUIが完成しました！とりあえずはアップスケーリングは一時中断してスキャン機能のさらなる調整案もお願いしたいです。ブログのコメントに上げてもらえると早急に処理に行える可能性が上がります！
07Jun
- さらに改良を！
  7. 追加アップデート：実写写真の極限クオリティへの挑戦ブログ初稿の作成以降、実写写真（特にポートレート）における「更なる自然さ」と「極限の瞳の美しさ」を追求し、以下のメジャーアップデートを実施しました。① 「背景ボケ」を活かして主役を引き立てる、背景シャープネス自動低減実写の人物写真などを高画質化する際、背景にある壁や小物のノイズまでシャープネスで強調されてしまい、画像全体がざらついて見える問題がありました。 MediaPipeによる背景分離: Googleの高速な背景分離AIを処理パイプラインに統合し、被写体（人物・動物）と背景のセグメンテーションマスクをリアルタイムで生成。シャープネスの個別適用: マスクを用いて被写体部分にはユーザー設定のシャープネスを適用し、背景部分には強度の15%程度の極めて弱いシャープネスのみを適用。エッジぼかし処理を組み合わせて合成することで、一眼レフで撮影したような「被写体がすっきりと引き立つ自然なポートレート」を実現しました。② 顔アライメント技術による「目の再現度」の劇的向上従来の簡易的な顔検出（Haar Cascade）では、顔の傾きに対応できず、また背景の模様や植物を誤検出する問題がありました。また、顔復元AI（GFPGAN）に顔の傾きや位置が揃っていない画像を入力していたため、瞳やまつ毛の復元クオリティが大幅に低下していました。高精度な「BlazeFace Detector」への刷新: 顔検出器をMediaPipe製にアップグレードし、誤検出を排除。左右の目の中心を含むキーポイントを正確にキャプチャ。精密な顔アライメント（アフィン変換）: 左右の目の角度と距離からアフィン変換行列を算出し、顔がまっすぐ前を向き、目の位置が所定の基準座標にぴったり重なるように回転・スケールを正規化した512x512の画像を生成してGFPGANに入力。逆アフィン変換による高精度な貼り戻し: 復元された超画質顔データを逆アフィン変換で正確な元の傾きと位置に戻し、卵型グラデーションマスクを用いて元の画像に滑らかにブレンド。これにより、瞳の光彩、二重まぶたのライン、まつ毛の１本１本までがブレることなく鮮明に、かつ極めて高い再現度で復元されるようになりました。③ 実写写真に最適化されたデフォルト起動モデルAIアップスケール時に対象が「つるっとしたイラスト風」になってしまう違和感を解消するため、起動時の初期動作モデルを見直しました。アニメ画像専用の「Fast（高速）」モデルから、写真のディテールや質感を忠実にアップスケールする実写用の**「Standard（高画質）」モデル**を初期デフォルトに変更。起動した時点で実写に最適な状態でスタートできるようにしました。④ 直感的な操作を促すUI/UXのブラッシュアップユーザーが処理の進行状況を把握しやすく、またプレビューを確認しやすいよう画面構成を調整しました。プログレスバーの配置改善: 処理中のプログレスバーを、これまでの「保存ボタンの下」から**「ログ表示テキストの直下」**に移動。ステータスと進捗を同時に確認可能に。倍率表示の最適化: これまで左側に表示されていたズーム率表示を**プレビューキャンバスのトップ中央（左右の中央）**へ移動し、数値をスケーリング率（%）へと変更。プレビューのズーム状態が直感的に視認できるようになりました。
06Jun
- アップスケールアプリの補足
  先ほど書いたアプリの使用でどれくらい変わるかの画像をのせておいた方がいいですよね！フリーの素材でできるだけ解像度の高くないものを探してきてテストしてみましたこちらがアップスケールする前の画像こちらがアップスケール後の画像サムネだとわからないかもしれませんが、明らかに高解像度になってると思います！ここからいろんな機能を追加していければいいですねただRTXシリーズのGPUが必要ですが・・・
- 初めてのAntigravity IDEよるバイブコーディング
  AI技術で画像を極限まで美しく！個人開発で「高画質化デスクトップアプリ」を作った全プロセスまとめこんにちは！本日は、AI（人工知能）を活用して画像の解像度を上げつつ、ノイズ除去やシャープネス調整、さらに人物の「顔・瞳・髪の毛」の不自然さを解消する**超本格的なデスクトップ画像アップスケーラーアプリ「AI Image Upscaler & Sharpener EX」**を開発した流れと、その技術的な裏舞台をブログ記事としてまとめました。PythonとPyTorch、 Redmondや最新のAIモデル（Real-ESRGAN & GFPGAN）を組み合わせ、GPUを活用した高速処理とモダンなダークモードUIを備えた実用的なツールが完成するまでのストーリーです。1. 作成したアプリ「AI Image Upscaler & Sharpener EX」の概要今回開発したのは、低解像度の画像をAIの力で4倍に拡大し、さらに画質を劇的に向上させるWindowsデスクトップアプリケーションです。主な特徴と機能超解像アップスケーリング: AIモデル（Real-ESRGAN）により、ディテールを保ったまま画像を4倍に拡大。人物・顔の超高画質化: GFPGAN（ONNX Runtime）を統合し、AI拡大で不自然になりがちな「瞳」や「髪の毛」「肌の質感」をピンポイントで補正・美化。直感的な「Before / After」比較: 中央のスライダーをドラッグすることで、処理前と処理後の画質を左右でダイレクトに比較可能。さらにマウスホイールによる自由な「位置基準ズーム」と「ドラッグ移動（パン）」に対応。画質自動チューニング（被写体別プリセット）: 生物、物質、風景写真などの対象に合わせ、ノイズ除去（Denoise）やシャープネス（Sharpness）の強度を適正値に自動調整。モダンなUI/UX: CustomTkinterを採用した、目に優しいプレミアムなダークモードデザイン。進捗インジケーター: 進捗率（%）と処理ステータスをリアルタイムでバー表示。2. 開発で使用した技術スタックデスクトップアプリとして完結し、かつローカルPCのパワーを最大限に引き出すために以下の技術を採用しました。言語: Python 3.13 GUIフレームワーク: CustomTkinter (Tkinterをモダンに拡張したライブラリ) ディープラーニングフレームワーク: PyTorch 2.6.0 (CUDA 12.4対応でGPUをフル活用) AI超解像モデル: Real-ESRGAN (RRDBNet) RealESRGAN_x4plus (標準・高精度 23ブロックモデル) RealESRGAN_x4plus_anime_6B (高速・アニメ用 6ブロックモデル) 顔復元モデル: GFPGAN v1.4 (ONNX Runtimeによる高速実行) 画像処理: OpenCV, Pillow (PIL), NumPy3. アプリ作成のステップ・開発の流れ開発は以下の5つのフェーズに分けて段階的に進めました。Step 1: 開発環境の構築Python 3.13と、NVIDIA製GPU（RTX 3080）のパワーを引き出すためのCUDA環境（PyTorch + CUDA 12.4）を仮想環境（venv）内に構築しました。最新のPython 3.13ではライブラリの対応バージョンがシビアなため、互換性のあるホイールを厳選してインストールしました。Step 2: AIアップスケールエンジンの実装まずはGUIなしで、画像を読み込んでAIで拡大するコアロジック（upscaler.py）を作成しました。PyTorchによるGPU処理、メモリを節約するためのハーフ精度（FP16）オートキャスト、および画像サイズが大きい場合に分割処理するタイリング機能（タスク切り分け）を実装しました。Step 3: GUIの基礎構築とマルチスレッド化CustomTkinterを使って基本ウィンドウを作成しました。AIの重い処理中に画面がフリーズするのを防ぐため、画質向上処理はすべてバックグラウンドのスレッドで実行し、メインスレッド（UI側）へ進捗率（%）を通知するキューシステムを実装しました。Step 4: 「Before/After」比較UIの極限強化ここが一番こだわったポイントです。単に画像を並べるだけでなく、スクロールホイールで「マウスカーソルの位置を中心に拡大・縮小」ができ、さらに左ドラッグで自由に画像を移動（パン）できる本格的なキャンバスUIを自作しました。スライダーを動かすと、拡大・縮小された状態のままリアルタイムで超解像前後の比較ができます。Step 5: 被写体別プリセットと顔復元（GFPGAN）の追加「人物を拡大したときに瞳や髪の毛が不自然になる」という課題をクリアするため、テンセント社が開発した顔修復AI「GFPGAN」をONNX Runtime経由で統合しました。さらに、生物・物質・風景などの被写体タイプを選択するだけで、適切なノイズ除去とシャープネスが自動適用される機能を組み込みました。4. 開発中に発生した技術的トラブルと解決策個人開発にエラーはつきもの。今回もいくつかの大きな壁にぶつかりましたが、知恵を絞って解決しました。① 顔修復モデル（GFPGAN）のダウンロードリンクが401エラーに！問題: GFPGANモデルの公式ダウンロード先がリンク切れや認証エラー（401）を起こし、アプリ起動時やモデルロード時にクラッシュする問題が発生。解決策: 堅牢性を高めるため、複数の信頼できるミラーURL（Hugging Face等）をリスト化し、どれか1つが失敗しても自動的に次のURLからダウンロードを試行する「マルチミラーフォールバックシステム」を実装しました。また、万が一ダウンロードが完全に失敗した場合でも、顔復元機能のみを優雅にスキップして処理を続行する例外処理を施しました。② PyTorch 2.6.0の警告エラー対応問題: コード内で使用していた torch.cuda.amp.autocast がPyTorchの最新バージョンで非推奨となり、警告やエラーが発生。解決策: 最新の書き方である torch.amp.autocast('cuda', ...) にコードをアップデートし、最新の環境でも警告なしで最適に動作するように修正しました。③ アプリがはみ出るレイアウト問題問題: 低解像度のノートPCの画面などで、UIパーツや比較画像の一部が画面外にはみ出て見えなくなってしまう問題が発生。解決策: ウィンドウの初期サイズを適切に調整するとともに、画像表示部がウィンドウのサイズ変更に応じて自動的に引き伸ばされるレスポンシブなグリッドレイアウト（grid_rowconfigure/grid_columnconfigure）に再設計しました。5. こだわりの機能紹介🌟 被写体プリセットによる最適化AIによる高画質化は、被写体によって最適なパラメータが異なります。生物: 毛並みや肌を柔らかく保つため、ノイズ除去を「弱」、シャープネスを「中」に。物質: 金属や文字の輪郭を際立たせるため、シャープネスを「強」に。風景: 空などのノイズを消しつつディテールを残すため、ノイズ除去を「強」、シャープネスを「中」に。これらをワンクリックで切り替えられるようにしました。🌟 顔復元（GFPGAN）の効果特に人物の顔部分（特に瞳と髪の毛）は、通常の超解像AIだけだと不自然なドット感が出てしまいます。GFPGANを組み合わせることで、ぼやけた目元がパッチリとクリアになり、髪の毛の質感も驚くほど自然に復元されるようになりました。6. まとめと今後の展望今回、AIの技術をぎゅっと詰め込んだデスクトップアプリを無事完成させることができました。Pythonの強力なAIライブラリ群と、CustomTkinterによるモダンなGUI開発の組み合わせは非常に強力で、個人開発とは思えないクオリティのツールを構築することができました。一応、プログラムを起動させたアプリの画像も載せておきます！このアプリケーションは完全ローカル環境で動作するため、アップロードした画像が外部のサーバーに送信される心配がなく、プライバシー面でも非常に安全です。
- はじめまして！
  はじめまして、なかちょです。今日からこのブログで、ボクの日常の「モノづくり」についての記録を綴っていこうと思います。実は以前、10年ほど前にこのアカウントを作っていたんですが、いろいろあって放置していました。改めてここをのぞいてみたら、当時の自分が少し懐かしくなりました。せっかくなので、この場所を新しいスタート地点にしようと決めました。ボクは、発達障害という特性と付き合いながら、日々いろんなことに挑戦しています。正直、人より時間がかかったり、思うようにいかなかったりして、落ち込むことも少なくありません。でも、そんなボクにとって「モノづくり」は、自分を表現したり、困難を乗り越えるための大切な「拠り所」なんです。このブログでは、主にこんなことを書いていこうと思っています。プラモデル製作：ガンダムや美プラなど、大好きなキットを組み立てる様子や、こだわり。 AIアプリ開発：自分で使いやすいアプリを作るための、技術的な悪戦苦闘の記録。日々の気づき：発達障害と向き合いながら、どうやってモノづくりを楽しんでいるか。ゲームの小話：ゲームも好きなので面白いことがあればのせるかも「上手くいくことばかりじゃないけど、こうやって工夫したら動いた！」「このプラモの造形、最高！」そんな小さな喜びや試何錯誤を、同じようにモノづくりが好きな人や、同じ悩みを持つ人と共有できたら嬉しいなと思っています。基本的には、自分のペースでゆったりと更新していくつもりです。技術的な話から、ただの趣味の報告まで幅広く書いていく予定ですので、見かけたら気軽にコメントいただけると励みになります！これからどうぞ、よろしくお願いします。