Playground Web

# Favoriten

13 Tools verfügbar

13

Claude Design

Claude Design verwandelt textbasierte Anweisungen in fertige Designs, interaktive Prototypen, Wireframes, Pitch‑Decks und Marketingmaterialien. Das Tool arbeitet dialogbasiert: Du beschreibst, was du brauchst, Claude erstellt eine erste Version, und du verfeinerst sie per Chat, Inline‑Kommentaren oder direkten Bearbeitungen. Es nutzt automatisch das Designsystem deines Teams (Farben, Typografie, Komponenten) und kann Inhalte aus Codebasen, Screenshots, Dokumenten oder Web‑Captures übernehmen, um realistische, markenkonsistente Ergebnisse zu erzeugen.

Funktionen von Claude Design – als Liste mit Kurzbeschreibung Konversationsbasiertes Designen — Du beschreibst im Chat, was du brauchst; Claude erzeugt sofort ein visuelles Ergebnis auf der Canvas. Interaktive Prototypen — Statische Mockups werden zu klickbaren, realistischen Prototypen, die ohne Code getestet und geteilt werden können. Produkt‑Wireframes & Mockups — Ideal für Produktmanager: schnelle Feature‑Flows, UI‑Layouts und Übergabe an Entwickler. Design‑Explorationen — Erzeugt viele visuelle Richtungen gleichzeitig, um Varianten schnell zu vergleichen. Pitch‑Decks & Präsentationen — Aus einer groben Outline entsteht ein vollständiges, markenkonsistentes Deck; Export als PPTX oder Canva. Marketing‑Materialien — Landingpages, Social‑Media‑Assets, Kampagnenvisuals – alles im Stil deiner Marke. Frontier‑Design (Voice, Video, 3D, Shader) — Erstellen von experimentellen, code‑gestützten Prototypen mit modernen Medienformaten. Automatisches Designsystem — Claude liest Codebasen & Designfiles und baut daraus ein vollständiges Designsystem, das in jedem Projekt automatisch angewendet wird. Import aus beliebigen Quellen — Upload von Bildern, Screenshots, DOCX, PPTX, XLSX oder Web‑Capture direkt von deiner Website. Feinsteuerung & Iteration — Anpassung über Chat, Inline‑Kommentare oder von Claude generierte Custom‑Slider. Exportformate — Export als URL, PDF, PPTX, HTML oder direkt nach Canva. Team‑ und Enterprise‑Integration — Nutzung im Team, inklusive mehrerer Designsysteme und kollaborativer Workflows.

Claude von Anthropic

Die Seite bietet Zugang zu Claude von Anthropic – einem KI-Assistenten der Claude 4.X-Familie (Opus 4.7, Sonnet 4.6, Haiku 4.5). Claude generiert Texte, schreibt und debuggt Code, analysiert Dokumente und Bilder, kann über Computer Use sogar Browser und Apps eigenständig bedienen. Anmeldung per Google oder E-Mail, Nutzung im Browser, Desktop- oder Mobile-App. Schwerpunkte: Teamarbeit, Datenschutz und produktive Workflows.

Was du mit Claude.ai machen kannst: Texte schreiben und überarbeiten – Artikel, E-Mails, Zusammenfassungen oder kreative Inhalte mit Fokus auf Klarheit und Stil. Code generieren und analysieren – viele Programmiersprachen, Fehlererkennung, Erklärungen, Optimierung. Über Claude Code auch agentisches Entwickeln. Dateien hochladen und analysieren – PDFs, Bilder oder Dokumente extrahieren, zusammenfassen, interpretieren. Bilder verstehen – Analyse und Beschreibung für UI-Feedback, Diagramme oder OCR. Artifacts – interaktive Visualisierungen, Diagramme, SVG-Grafiken und Web-Apps direkt im Chat erzeugen. Recherche und Websuche – Zugriff auf aktuelle Webinhalte und komplexe Research-Aufgaben. Projekte organisieren – Chats in Projekte gliedern, mit persistentem Projekt-Memory für Teamarbeit. Skills (seit Okt. 2025) – anpassbare Task-Automatisierungen für wiederkehrende Aufgaben. MCP-Integration – Anbindung an 6.000+ Apps wie GitHub, Slack, Jira, Google Drive oder Stripe. Google Workspace Integration (Pro) – Verknüpfung mit Gmail, Google Kalender und Docs. Computer Use – Claude bedient Browser und Desktop-Anwendungen selbstständig für agentische Workflows. Erweiterte Denkprozesse (Pro & Max) – Extended Thinking für tiefere Analysen, Planung und komplexe Problemlösungen. Claude Design (Anthropic Labs, seit April 2026) – gemeinsam mit Claude visuelle Outputs wie Designs, Prototypen, Slides und One-Pager erstellen. 1M-Token-Kontextfenster – für Opus 4.6 und Sonnet 4.6 ohne Aufpreis verfügbar, ermöglicht die Analyse sehr großer Dokumente und Codebasen in einem Rutsch. Hinweis: Claude ist in verschiedenen Tarifen verfügbar – von kostenlos bis Enterprise mit Prioritätszugang und erweiterten Funktionen.

Copilot

Copilot – KI-Chatbot mit erweiterten Funktionen wie Bilderstellung und Reiseplanung

Microsoft Copilot bietet nicht nur Chat- und Textfunktionen, sondern kann auch Bilder generieren, Reisepläne erstellen, Rezepte vorschlagen und Fitnesspläne anpassen. Die KI kann den Schreibstil verändern und verschiedene Sprachen verarbeiten. (https://copilot.microsoft.com/)

Google AI Pro-Abo

Das Google AI Pro-Abo bündelt Googles leistungsstarke KI-Dienste in einem Paket: Zugriff auf Gemini 3.1 Pro mit 1-Million-Token-Kontextfenster, Deep Research, Jules als Coding-Agent, einen Videogenerator-Trial mit Veo 3.1 Lite und die Gemini-Integration in Gmail, Docs, Sheets und weiteren Google-Apps. Dazu erweiterte NotebookLM-Kontingente und 5 TB Cloud-Speicher für Drive, Gmail und Fotos.

Was du mit dem Google AI Pro-Abo machen kannst: Gemini App – höherer Zugriff auf Gemini 3.1 Pro, das aktuelle Top-Modell für komplexe Aufgaben, Recherche und längere Kontexte. 1M-Token-Kontextfenster – verarbeite PDFs mit bis zu 1.500 Seiten, lange Texte und umfangreiche Codebasen in einem Rutsch. Deep Research – automatisierte, tiefgehende Recherche über hunderte Webseiten, inklusive strukturiertem Bericht mit Quellen. Jules – KI-Coding-Agent, der Aufgaben im Repository selbstständig bearbeitet und Pull Requests erstellt. Veo 3.1 Lite (Trial) – schnelle Videogenerierung aus Text oder Bildern für Social-Clips und Prototypen. AI Credits – 1.000 Credits pro Monat für kreditpflichtige Funktionen wie Videogenerierung oder Bildbearbeitung. NotebookLM erweitert – bis zu 500 Notebooks, 300 Quellen pro Notebook, 500 Chat-Anfragen pro Tag und fünfmal mehr Audio-Overviews als in der Gratis-Version. Gemini in Workspace – Schreib-, Analyse- und Tabellen-Hilfe direkt in Gmail, Google Docs, Google Sheets, Slides und Meet. Cloud-Speicher – 5 TB für Google Drive, Gmail und Google Fotos, teilbar per Familienfreigabe mit bis zu fünf weiteren Personen. Hinweis: Google AI Pro kostet rund 19,99 USD pro Monat; für noch höheren Zugriff auf neueste Modelle und Kontingente gibt es das Google AI Ultra-Abo.

Google AI Studio

Google AI Studio ist eine kostenlose webbasierte Entwicklungsumgebung von Google, mit der du KI-Anwendungen auf Basis der Gemini-Modelle prototypen, testen und direkt auslieferst. Du hast freien API-Zugriff auf Gemini 2.5 Pro, 2.5 Flash und die Gemini 3 Flash Preview, kannst in natürlicher Sprache Apps bauen ("Vibe Coding"), Firebase automatisch bereitstellen lassen und Funktionen wie Bildgenerierung (Nano Banana), Videogenerierung (Veo), Sprachsynthese, Live-Dialoge und URL-Kontext per AI Chips hinzufügen.

Was du mit Google AI Studio machen kannst: Build Mode (Vibe Coding) – Apps per natürlicher Sprache beschreiben und iterieren; mit Code-Tab für direkten Eingriff in den generierten Code. Full-Stack-Runtime – Server-Logik, geheime Keys und npm-Pakete in einer Cloud-Runtime ausführen, ohne eigenen Server aufzusetzen. Firebase-Auto-Provisioning – AI Studio legt Firestore-Datenbank und Firebase Authentication automatisch an und verdrahtet sie mit deiner App. Echtzeit-Kollaboration – mehrnutzerfähige Erlebnisse, bei denen die Runtime Verbindungen und Status synchronisiert. Foto-Bearbeitung per Text (Nano Banana / Gemini 2.5 Flash Image) – Objekte hinzufügen, Hintergründe entfernen, Stile anpassen. Bildgenerierung (Nano Banana Pro) – hochwertige Bilder aus Textprompts für Content, Illustrationen oder Marketingassets. Bilder animieren mit Veo – einzelne Bilder in kurze Clips oder Werbe-Animationen verwandeln. Prompt-basierte Videoerzeugung – aus Textskripten oder Blogposts kurze Videos generieren. Konversationelle Sprach-Apps (Gemini Live) – sprachbasierte Dialoge mit Mikrofon-Eingabe und natürlicher Sprachausgabe. Sprachausgabe (Text-to-Speech) – Text in natürlich klingende Sprache für Vorleser oder Sprachinterfaces umwandeln. Audio transkribieren – Audio per Batch oder Echtzeit in Text, z. B. für Untertitel oder Notizen. Video-Verständnis – Schlüsselszenen erkennen, Zusammenfassungen, Lernkarten oder Highlights aus langen Videos erzeugen. URL Context – Inhalte von Web-Links direkt in Prompts einbeziehen und aktuell halten. Google Search Grounding – Antworten mit aktuellen Suchergebnissen belegen und Quellen anfügen. Google Maps Grounding – Orte, Routen und ortsbezogene Informationen in Apps einbauen. Thinking Mode – längere, ressourcenintensivere Verarbeitung für komplexe Reasoning-Aufgaben. Flash-Lite für schnelle Antworten – niedrige Latenz für Autocomplete, interaktive Agenten oder Live-Features. Bildseitenverhältnisse steuern – präzise Kontrolle über Ausgabeformate. Bilder analysieren – Informationen aus Belegen, Menüs, Diagrammen extrahieren, zusammenfassen oder übersetzen. App-Galerie – Beispiel-Apps und Vorlagen als Inspirationsquelle und Startpunkt zum Remixen. Hinweis: Die Nutzung von Google AI Studio ist kostenlos. Für produktive API-Nutzung über die Gratis-Kontingente hinaus gelten die Gemini-API-Preise von Google Cloud.

Google Antigravity

Google Antigravity ist eine agentenorientierte Entwicklungsplattform (AI-IDE), in der KI-Agenten Aufgaben planen, ausführen und verifizieren — über Editor, Terminal und Browser hinweg. Betrieben wird sie von Gemini 3.1 Pro (mit 2-Millionen-Token-Kontextfenster) und Gemini 3 Flash; damit lassen sich komplette mittelgroße Codebasen in einem Rutsch erfassen. Antigravity ist aktuell als Public Preview kostenlos für Einzelnutzer verfügbar.

Was du mit Google Antigravity machen kannst: Editor View – KI-gestützter Code-Editor mit Tab-Autovervollständigung und kontextsensitiven Inline-Befehlen für den synchronen Workflow. Manager Surface – Oberfläche zum Starten, Orchestrieren und Beobachten mehrerer asynchron arbeitender Agenten in verschiedenen Workspaces. Agenten-Workflows – Agenten planen und erledigen Aufgaben end-to-end: Feature implementieren, Tests laufen lassen, Browser-Checks, Verifikation. Planning Mode – Agenten erzeugen ausführliche Planungsartefakte (Walkthroughs, Aufgabenlisten, Verifikationsschritte), die du vor der Ausführung prüfen und anpassen kannst. Fast Mode – schneller Ausführungsmodus für kurze, risikoarme Aktionen, optional mit Überprüfungsstufe. Browser Sub-Agent – steuert eine headless oder sichtbare Chromium-Instanz und nutzt die multimodalen Fähigkeiten von Gemini 3, um Web-Apps wie ein Mensch zu "sehen" und zu bedienen. Artifacts und Verifikation – Agenten liefern greifbare Ergebnisse wie Screenshots, Implementierungspläne und Test-Outputs statt nur Logs, um Nachvollziehbarkeit sicherzustellen. Interactive Feedback – du kannst Google-Docs-artige Kommentare direkt auf den Artefakten hinterlassen; der Agent übernimmt das Feedback sofort, ohne die Aufgabe neu zu starten. Persistent Learning – Agenten speichern nützlichen Kontext und Code-Snippets in einer Wissensbasis und werden über Aufgaben hinweg besser. Mehrere Modelloptionen – Wahl zwischen Gemini 3.1 Pro (2M-Token-Kontext) und Gemini 3 Flash, abhängig von Tiefe und Geschwindigkeit. Cross-Surface Tooling – Editor, Terminal und Browser werden parallel bedient, damit Aufgaben komplett automatisiert ablaufen (schreiben, ausführen, testen, verifizieren). Asynchrone Delegation – Aufgaben langfristig an Agenten übergeben und Fortschritt später kontrollieren, ohne ständig eingreifen zu müssen. Projekt- und Kontextbewusstsein – Agenten nutzen Projektdateien und Umgebungen, respektieren virtuelle Umgebungen und verwenden bestehende Artefakte wieder. Hinweis: Antigravity läuft als Public Preview und ist für Einzelnutzer kostenlos. Bei produktivem Einsatz Sicherheitsempfehlungen beachten und Agenten zunächst im Planning Mode mit nicht-kritischen Tasks einsetzen, bevor du mehr Autonomie freigibst.

google flow

Google Flow ist das KI-Filmemacher-Werkzeug von Google Labs, das Bild- und Videogenerierung in einer Oberfläche vereint. Seit 2026 sind die früheren Einzelprodukte Whisk und ImageFX direkt in Flow integriert, sodass du von der Idee über hochauflösende Bilder bis zum animierten, vertonten Video alles in einem Workflow erzeugst. Unter der Haube laufen Veo 3.1 für Video mit nativer Audiospur und Nano Banana (Gemini 2.5 Flash Image) für Bilder. Ausgabe bis 4K mit realistischer Physik, Beleuchtung und Bewegung. Nutzung mit Google-Konto, einige Premium-Features sind dem Google AI Ultra-Abo vorbehalten.

Was du mit Google Flow machen kannst: Text-zu-Video mit Veo 3.1 – hochwertige Clips aus Textbeschreibungen in bis zu 4K erzeugen, mit realistischer Physik, Licht und Bewegung. Bild-zu-Video – aus einzelnen Bildern oder erzeugten Standbildern kurze animierte Szenen machen. Native Audiospur – Umgebungsgeräusche, Dialoge und Musik werden direkt passend zum Bild generiert, inklusive lippensynchronem Sprechen. Nano Banana integriert – hochauflösende Bilder mit Gemini 2.5 Flash Image direkt in Flow erzeugen und ohne Umweg als Frames für Videos nutzen. Scene Extension ("Was passiert als Nächstes") – einen Clip nahtlos weiterlaufen lassen, um längere Sequenzen zu bauen. Object Removal – unerwünschte Objekte per Maske und optionalem Prompt aus dem Video entfernen. Camera Adjustments – Kameraposition und -bewegung (Pan, Zoom, Schwenk) in bereits generierten Clips nachträglich steuern; inzwischen in allen Tarifen verfügbar. Text-Prompts im Clip – neue Elemente per Textbefehl ins Video einfügen. Kreatives Komponieren – Bilder, Clips und Audio in einer Oberfläche zu einer kompletten Kurzgeschichte zusammenbauen. Hinweis: Flow ist mit Google-Konto nutzbar; für Veo-3-Early-Access, höhere Auflösungen und erweiterte Kontingente ist das Google AI Ultra-Abo erforderlich. Google speichert den Verlauf standardmäßig bis zu 18 Monate.

Google Gemini Enterprise

Google Gemini Enterprise ist eine agentenbasierte KI-Plattform für Unternehmen, die auf Gemini 3 aufbaut. Teams können darin eigene KI-Agenten entdecken, erstellen, teilen und ausführen – zentral verwaltet und mit Enterprise-Sicherheit. Vorintegriert sind Google-Agenten wie Deep Research, NotebookLM und Coding Agents, dazu kommt Google Workspace Studio für die No-Code-Agent-Erstellung direkt in Workspace. Integrationen gibt es zu Google Workspace, Microsoft 365, Salesforce, SAP und BigQuery. Bei Neuanmeldung mit Google-Konto ist eine 30-tägige kostenlose Testphase möglich; Nano Banana Pro ist nutzbar.

Was du mit Google Gemini Enterprise machen kannst: Zugriff auf Gemini-3-Modelle – neueste multimodale Modelle für Analyse, Text, Bild und Video in einem geschäftlichen Kontext. Workspace Studio – eigene Agenten in Minuten erstellen, verwalten und teilen, direkt in Google Workspace; komplett ohne Code. No-Code-Agenten erstellen – Fachabteilungen bauen ohne Programmierkenntnisse Agenten für Workflows und Datenanalysen. Fertige Google-Agenten nutzen – Deep Research, NotebookLM und Coding Agents sind sofort einsatzbereit für Recherche, Wissensmanagement und Entwicklung. Eigene und Drittanbieter-Agenten integrieren – über das Agent Development Kit (ADK) eigene Agenten einbinden oder externe Agenten aus dem Ökosystem anschließen. Unternehmensdaten sicher einbinden – Data-Store-Anbindung an Google Workspace (Calendar, Gmail, Drive, NotebookLM), Microsoft 365, Salesforce, SAP und BigQuery. MCP-Server (Vertex AI Search) – Google-managed Model-Context-Protocol-Server zur sicheren Datenanbindung für Agenten. Zentrale Verwaltung und Governance – Richtlinien, Berechtigungen und Audits zentral; unterstützt Compliance-Anforderungen wie HIPAA und FedRAMP High, dazu VPC Service Controls, CMEK und Access Transparency. Workflow-Automatisierung – plattformübergreifende Prozesse für Marketing, HR, Finanzen und Technik mit integrierten Konnektoren. Fachspezifische Einsätze – Vertrieb (Kundenanalyse, Reporting), Technik (Coding-Agenten), HR (Dokumente, Analysen), Finanzen (Datenanalyse, Forecasting), Marketing (Trends, Creative-Assets, Performance-Berichte). Sichere Skalierung – kontrollierter unternehmensweiter Rollout mit Audit-Funktionen und Richtlinienmanagement. Tarife – Gemini Business für kleine Unternehmen und Teams; Gemini Enterprise Standard und Plus für größere Organisationen mit erweiterten Sicherheits- und Governance-Anforderungen. Hinweis: Bei Anmeldung mit Google-Konto ist eine 30-tägige Testphase möglich.

Google Wisk

Whisk ist das visuelle Prompting-Tool aus den Google Labs FX, mit dem du Bilder nicht per langer Textbeschreibung, sondern per Bildbausteinen für Subjekt, Szene und Stil erzeugst. Gemini analysiert deine hochgeladenen Bilder, erstellt daraus automatisch Prompts und übergibt diese an Imagen für die finale Bildausgabe. Mit Whisk Animate lassen sich die generierten Bilder per Veo 2 in kurze Clips umwandeln. Seit März 2026 ist Whisk zusätzlich direkt in Google Flow integriert, wo es zusammen mit ImageFX und Video-Generierung in einer gemeinsamen Oberfläche nutzbar ist.

Was du mit Whisk machen kannst: Visuelles Prompting – eigene oder generierte Bilder als Bausteine für Subjekt, Szene und Stil verwenden, statt lange Textprompts zu schreiben. Bildanalyse durch Gemini – Gemini erkennt, was auf deinen Upload-Bildern zu sehen ist, und formuliert daraus automatisch einen detaillierten Prompt. Bildgenerierung mit Imagen – aus dem erzeugten Prompt generiert Imagen das finale Bild; kreative Remixes mehrerer Referenzen sind möglich. Zufallsgenerator – per Klick auf "würfeln" neue Kombinationen und Inspiration bekommen. Freitext-Eingabe – eigene Ideen weiterhin direkt in Textform ergänzen oder präzisieren. Whisk Animate – das erzeugte Bild per Klick mit Veo 2 in einen kurzen Videoclip animieren. Mediathek – Szenen, Stile und Ideen in "Meine Mediathek" speichern und später wiederverwenden. Integration in Google Flow – seit März 2026 ist Whisk zusätzlich direkt in Flow nutzbar, zusammen mit ImageFX und Video-Generierung in einer gemeinsamen Oberfläche. Hinweis: Whisk ist ein experimentelles Labs-Tool; Ergebnisse sollten kontrolliert werden. Nutzung mit Google-Konto, einige Premium-Funktionen sind im Google AI Pro/Ultra-Abo enthalten.

i10x.ai

i10X ist ein All-in-One-KI-Arbeitsbereich, der den Zugriff auf die großen Sprachmodelle (u. a. GPT-5, Claude, Gemini, Perplexity, Grok, DeepSeek) mit Bild- und Videogenerierung, Dokumentenanalyse, über 500 spezialisierten KI-Agenten und einem visuellen No-Code-Workflow-Builder in einer einzigen Plattform vereint. Ziel: Einzelabos reduzieren, wiederkehrende Aufgaben automatisieren und Modelle direkt nebeneinander vergleichen. Neuerungen nachlesbar auf https://i10x.ai/news. Übersicht der KI-Agenten: https://i10x.ai/de/discover

Was du mit i10X machen kannst: Multi-Model-Chat – ein Interface mit Zugriff auf GPT-5, Claude, Gemini, Perplexity, Grok und DeepSeek; Modelle wechseln und Antworten direkt nebeneinander vergleichen. Bild- und Videogenerierung – Erzeugung und Bearbeitung mit Modellen wie Kling, Veo und Stable Diffusion; Hintergrund entfernen, Visuals upscalen, Social-Media-Assets bauen. Dokumenten-KI – PDFs und Dokumente hochladen, zusammenfassen, analysieren und im Chat befragen (z. B. Verträge prüfen, Berichte extrahieren). Über 500 spezialisierte KI-Agenten – vorgefertigte Tools für Business, Marketing, Recht, Coding, SEO, Fitness und vieles mehr. Visueller Workflow-Builder – per Drag-and-Drop Automationen bauen und externe Tools wie Gmail, Notion, Slack oder Stripe anbinden. AI Intelligence Hub – kuratierter News-Feed mit Modell-Updates, Benchmarks, Fallstudien und Regulierungen, gefiltert in einem Kanal statt über viele verstreute Quellen. Vorlagen und Beispiele – sofort nutzbare Templates für Workflows und Agenten zum schnellen Einstieg. Kommerzielle Lizenz – generierte Inhalte dürfen in allen Plänen kommerziell verwendet werden. Hinweis: Die Einstiegstarife beginnen bei rund 8 USD pro Monat; ein einzelner Zugang ersetzt mehrere Einzelabos für die großen KI-Modelle.

M365 Microsoft Copilot

Microsoft 365 Copilot ist der KI-Assistent, der direkt in Word, Excel, PowerPoint, Outlook und Teams arbeitet. Seit 2026 erweitert um den Agent Mode in Office-Apps und den Office Agent, mit denen Copilot Dokumente, Tabellen und Präsentationen nicht nur vorschlägt, sondern aktiv bearbeitet – jede Änderung bleibt dabei nachvollziehbar und rücksetzbar. Copilot greift auf persönliche Daten aus M365 zu, nutzt Web-Quellen und bindet Agenten aus Drittanbieter-Apps wie Adobe Express, Figma, Optimizely oder Dynamics 365 direkt in den Arbeitsfluss ein.

Was du mit Microsoft 365 Copilot machen kannst: Integration in Microsoft 365 – arbeitet direkt in Word, Excel, PowerPoint, Outlook und Teams, ohne die gewohnte Oberfläche zu verlassen. Agent Mode in Office-Apps (seit Feb 2026) – Copilot bearbeitet Dokumente, Tabellen und Folien eigenständig auf Prompt; jede Änderung ist transparent, prüfbar und rücksetzbar. Office Agent – erledigt komplexe Multi-Step-Aufgaben über Apps hinweg, passt Folien an Layouts, Objektstile und Brand Kits deiner Organisation an. Text- und Inhaltsgenerierung – Texte schreiben, Präsentationen erzeugen, Dokumente zusammenfassen; Stil und Tonalität anpassbar. Datenanalyse in Excel – komplexe Daten auswerten, Trends erkennen, echte Formeln, Pivot-Tabellen und Diagramme automatisch erzeugen. Meeting-Vorbereitung und -Zusammenfassung – Agenda-Vorschläge, relevante Dokumente bereitstellen, Zusammenfassungen mit Entscheidungen und To-dos nach dem Meeting. E-Mail und Kommunikation – Entwürfe, Zusammenfassung langer Threads, Antwortvorschläge direkt in Outlook. Unternehmenssuche – findet Inhalte über E-Mails, Dateien, Chats und Kalender hinweg, mit kontextbezogenen Antworten. Copilot Notebooks als Grounding-Quelle – Agenten können auf ein Notebook als kuratierten Referenzbestand zugreifen, damit Antworten konsistent zu deinem Material bleiben. Drittanbieter-Agenten – Agenten aus Apps wie Adobe Express, Figma, Optimizely oder Dynamics 365 liefern visuell reichhaltige, interaktive Ergebnisse direkt im Copilot-Chat. Web- und Wissensintegration – aktuelle Web-Informationen ergänzen persönliche Daten für umfassendere Antworten. Routine-Automatisierung – Terminplanung, Formatierungen und Standarddokumente werden automatisch übernommen. Personalisierung – Copilot lernt aus dem Kontext und passt Vorschläge an die individuelle Arbeitsweise an. Hinweis: Copilot-Funktionen erfordern eine M365-Copilot-Lizenz; Agent Mode und Office Agent rollen schrittweise in M365-Copilot-Kundenumgebungen aus.

Notebook LM von Google

NotebookLM ist Googles KI-Research- und Lernassistent, der auf deinen eigenen Quellen aufbaut. Du lädst Dokumente, PDFs, Webseiten oder YouTube-Videos hoch, NotebookLM analysiert sie und erzeugt daraus Chat-Antworten, Audio Overviews (Deep-Dive-Podcasts), Video Overviews (erzählte Slides), Mind Maps und strukturierte Reports – jeweils mit Quellenbelegen. Das Tool eignet sich für Recherche, Studium und Wissensmanagement und ist als Teil des Google AI Pro-Abos mit erweiterten Kontingenten verfügbar.

Was du mit NotebookLM machen kannst: Quellen hochladen – PDFs, Dokumente, Webseiten, YouTube-Videos und Vorlesungsaufzeichnungen werden ins Notebook aufgenommen und bleiben Grundlage aller Antworten. Interaktiver Chat mit Zitaten – Fragen an deine Quellen stellen; jede Antwort ist mit direkten Verweisen auf die genutzten Stellen belegt. Audio Overviews – lebendige "Deep-Dive"-Podcasts, die die Kernideen deiner Quellen als Dialog zweier KI-Hosts zusammenfassen. Video Overviews – erzählte Slides, bei denen die KI neue Visualisierungen baut und Bilder, Diagramme, Zitate und Zahlen aus deinen Dokumenten einblendet. Mind Maps – automatische Baumdiagramme deiner Quellen; Äste lassen sich aufklappen und einklappen, um zwischen Überblick und Detail zu wechseln. Reports – strukturierte Berichte (z. B. Study Guides, Briefing Docs) direkt aus den Quellen erzeugen. Upgraded Studio – mehrere Outputs vom gleichen Typ in einem Notebook speichern; vier Kacheln für Audio Overviews, Video Overviews, Mind Maps und Reports; parallel hören, lesen und erkunden. Lernkarten und Quizzes – Wissensstand mit automatisch erzeugten Karten und Quizfragen prüfen. Stil und Ton anpassen – Länge und Tonalität der Antworten für Forschungsassistent, Tutor oder andere Rollen einstellen. Zusammenarbeit – Notebooks mit anderen teilen; gemeinsames Recherchieren und Diskutieren. Langzeitgedächtnis – Konversationen bleiben erhalten, damit du Recherchen über längere Zeit fortführen kannst. Hinweis: NotebookLM ist in der Basisversion kostenlos. Das Google AI Pro-Abo erweitert Limits deutlich (500 Notebooks, 300 Quellen pro Notebook, 500 Chat-Anfragen pro Tag, fünffach mehr Audio-Overviews).

Perplexity

Perplexity AI ist eine KI-gestützte Such- und Antwortmaschine, die Antworten immer mit Quellenverweisen liefert. Die Plattform bündelt Chat-Suche, Deep Research, Finance-Recherche, einen visuellen Workflow-/Labs-Modus (Create files and apps), Spaces für Team-Projekte und den Comet Browser als eigenständigen KI-Browser mit Agent-Modus. Im Hintergrund stehen führende Modelle wie GPT-5.4, Opus 4.6 und Sonnet 4.5 zur Auswahl.

Was du mit Perplexity machen kannst: Quellenbasierte Antworten – jede Antwort ist mit direkten Verweisen auf die verwendeten Webquellen belegt und so nachprüfbar. Modellauswahl – je nach Frage zwischen GPT-5.4, Claude Opus 4.6, Sonnet 4.5 und Perplexity-eigenen Sonar-Modellen umschalten; Model Council für Vergleichsantworten. Deep Research – mehrschrittige Recherche über viele Quellen mit strukturiertem, vollständig zitiertem Bericht. Learn step by step – geführte Lernpfade, die Themen in aufeinander aufbauenden Schritten erklären. Spaces – persistente Projekträume für Recherchen, Notizen und Chats; in Enterprise-Plänen als geteilte Team-Spaces. Labs (Create files and apps) – Erzeugung von Dokumenten, Dashboards oder kleinen Apps direkt aus Recherchen. Finance – Aktien- und Unternehmensrecherche mit Echtzeit-Charts, Analystenratings, 52-Wochen-Kurszielen und direkten Links in SEC-Filings an die relevante Stelle. Discover – thematisch kuratierte Feeds zu aktuellen News und Trends. Comet Browser – eigener KI-Browser mit Agent-Modus, Seitenzusammenfassungen, In-Page-Research und mehrstufigen autonomen Aufgaben (z. B. Dashboards analysieren, GitHub-Historie auswerten, Onboarding-Flows prüfen). Für iOS, Android, Windows und Mac kostenlos verfügbar; Max-Nutzer können das Modell des Browser-Agents wählen. Datei-Uploads – PDFs, Dokumente und Bilder analysieren, zusammenfassen oder daraus Inhalte extrahieren. Fokus-Optionen – Suche gezielt auf akademische Quellen, YouTube, Reddit oder Wolfram Alpha eingrenzen. API-Zugang – Perplexity-Fähigkeiten per Sonar-API in eigene Anwendungen und Workflows einbinden. Hinweis: Kostenlose Version für schnelle, quellengestützte Suche. Perplexity Pro bietet höhere Kontingente, Datei-Uploads und Modellauswahl. Max ergänzt Hintergrund-Agent und erweiterte Comet-Funktionen.

API-Schnittstellen

1 Tool verfügbar

1

Open Router

OpenRouter bietet eine einheitliche API‑Schnittstelle, über die du Hunderte von KI‑Modellen verschiedener Anbieter nutzen kannst – mit besserer Verfügbarkeit, Preisoptimierung, Routing‑Funktionen, Datenkontrolle und Edge‑Infrastruktur für schnelle Antwortzeiten.

Leistungen von OpenRouter (mit kurzer Erläuterung) Einheitliche API für viele KI‑Modelle Eine API, die Zugriff auf über 300 Modelle von mehr als 60 Anbietern ermöglicht – ohne für jeden Anbieter eigene Integrationen zu bauen. OpenAI‑kompatible Schnittstelle Die API funktioniert direkt mit bestehenden OpenAI‑SDKs, sodass bestehender Code ohne Anpassungen weiterläuft. Höhere Verfügbarkeit durch Provider‑Fallback Wenn ein Modell oder Anbieter ausfällt, routet OpenRouter automatisch zu anderen verfügbaren Providern, um Ausfälle zu vermeiden. Preis‑ und Performance‑Optimierung OpenRouter wählt kostengünstige oder schnellere Anbieter aus und betreibt Infrastruktur am Netzwerkrand (Edge), um Latenz zu reduzieren. Feingranulare Datenrichtlinien Organisationen können festlegen, welche Modelle und Provider Nutzerdaten erhalten dürfen – für Compliance und Datenschutz. Zentrale Kredit‑/Token‑Abrechnung Nutzer kaufen Credits, die für alle Modelle und Anbieter gelten – statt viele einzelne Abos oder Abrechnungen zu verwalten. Modell‑ und App‑Rankings Ein Dashboard zeigt Token‑Nutzung, Trends und Beliebtheit von Modellen und Apps. Agenten‑Ökosystem OpenRouter listet KI‑Agenten und Tools, die auf der Plattform laufen und von Millionen Nutzern verwendet werden. Edge‑Infrastruktur für geringe Latenz Die Ausführung erfolgt möglichst nah am Nutzer, um Antwortzeiten zu minimieren. Zentrale Verwaltung von API‑Keys Ein Dashboard zum Erstellen und Verwalten von API‑Schlüsseln für alle Modelle.

Assistant

1 Tool verfügbar

1

Google Gemini Live Mobile

Google Gemini Live – Mobiler KI-Assistent für Live-Gespräche

Gemini Live ermöglicht freie Gespräche mit einer KI auf dem Smartphone. Nutzer können unterwegs brainstormen, für Prüfungen lernen oder Geschäftsideen entwickeln und dabei jederzeit nachfragen oder das Thema wechseln. (https://blog.google/products/gemini/made-by-google-gemini-ai-updates/)

Assistant, Automatisierung

1 Tool verfügbar

1

BeforeSunset

BeforeSunset – KI-basierter Tagesplaner für Aufgaben und Kalender

BeforeSunset integriert Kalender, To-do-Listen und Notizen in einer KI-gestützten Oberfläche. Der Assistent schlägt bewährte Planungsmethoden vor und automatisiert wiederkehrende Abläufe, um den Tag effizient zu gestalten. (https://www.beforesunset.ai/)

Assistant, Automatisierung, Agent

2 Tools verfügbar

2

n8n

Die Anwendung n8n.io ist eine Open-Source-Workflow-Automatisierungsplattform, die es ermöglicht, verschiedene Apps, Dienste und Datenquellen miteinander zu verbinden. Sie bietet eine visuelle Oberfläche für die Erstellung komplexer Workflows ohne tiefgehende Programmierkenntnisse, unterstützt aber auch die Integration von Code für maximale Flexibilität. Ziel ist es, Prozesse zu automatisieren, Datenflüsse zu steuern und KI-gestützte Agenten einzusetzen – sowohl in der Cloud als auch selbst gehostet

⚙️ Funktionsübersicht mit Erklärungen Visuelle Workflow-Erstellung Workflows werden per Drag-and-Drop aufgebaut. Jeder Schritt ist ein „Knoten“, der eine Aktion oder Bedingung darstellt. So lassen sich komplexe Abläufe intuitiv gestalten. Über 300+ Integrationen Direkte Anbindungen an Tools wie Slack, Google Sheets, HubSpot, Notion oder Datenbanken. Damit können Datensilos aufgebrochen und Systeme nahtlos verknüpft werden. Conditional Logic (Bedingungslogik) Workflows können dynamische Entscheidungspfade enthalten. So reagiert ein Prozess flexibel auf unterschiedliche Szenarien, z. B. wenn bestimmte Daten fehlen oder Bedingungen erfüllt sind. Error Handling Robuste Fehlerbehandlung mit alternativen Aktionspfaden oder Benachrichtigungen. Dadurch bleiben Workflows stabil, auch wenn externe Systeme ausfallen. Self-Hosting & Datenschutz n8n kann lokal oder auf eigenen Servern betrieben werden. Dies gibt volle Kontrolle über sensible Daten und erleichtert die Einhaltung von Datenschutzrichtlinien. KI-Integration Möglichkeit, KI-Modelle wie GPT-4 oder Claude direkt in Workflows einzubinden. Damit lassen sich z. B. E-Mails automatisch verarbeiten oder Dokumente intelligent durchsuchen. Agentenbasierte Systeme Erstellung von Multi-Step-Agenten, die eigenständig Aufgaben erledigen können – etwa Datenanalyse, Kundenkommunikation oder Ticketbearbeitung. Code-Integration Neben der visuellen Oberfläche können Nutzer JavaScript oder Python einbinden. So lassen sich Workflows erweitern, APIs direkt ansprechen oder komplexe Logik implementieren. Debugging & Wiederholungen Einzelne Schritte lassen sich erneut ausführen, ohne den gesamten Workflow neu zu starten. Logs und Mock-Daten erleichtern die Fehlersuche. Vorlagenbibliothek (1700+ Templates) Große Auswahl an fertigen Workflow-Vorlagen für typische Anwendungsfälle. Diese können direkt genutzt oder angepasst werden. Integration von Webhooks & Triggern Workflows können durch externe Ereignisse gestartet werden, z. B. neue E-Mails, Formular-Eingaben oder API-Calls. Skalierbarkeit & Enterprise-Funktionen Unterstützung für Versionierung, Rollen- und Rechteverwaltung (RBAC), Audit-Logs und sichere Cloud- oder On-Premise-Deployments.

Teampal.ai

TeamPal ist eine Plattform zur Erstellung und Verwaltung von KI-gestützten Arbeitskräften („AI Workforce“). Ziel ist es, Unternehmen jeder Größe zu ermöglichen, ihre Prozesse zu automatisieren, die Produktivität zu steigern und branchenspezifische Herausforderungen mit intelligenten KI-Agenten zu lösen – ganz ohne Programmierkenntnisse. Mit TeamPal können Teams maßgeschneiderte KI-Assistenten entwickeln, die in Bereichen wie Marketing, Vertrieb, HR, Finanzen, Forschung und Design eingesetzt werden.die Reichweite zu erhöhen

Funktionsübersicht mit Erklärungen AI Workforce Bereitstellung vortrainierter KI-Agenten für verschiedene Rollen (z. B. Sales Analyst, Data Scientist, HR Manager), die sofort einsatzbereit sind. Industrielösungen Branchenspezifische KI-Pakete für Medien & Entertainment, Technologie, Retail & E-Commerce sowie Travel & Hospitality. Workspace-Erstellung Unternehmen können eigene Arbeitsbereiche anlegen, in denen Agenten die Geschäftsprozesse kennenlernen und direkt angepasst werden. Agenten-Bibliothek (80+ Templates) Große Auswahl an vorgefertigten Agenten-Vorlagen für unterschiedliche Abteilungen und Aufgaben. Custom Agents Möglichkeit, eigene Agenten zu erstellen und deren Fähigkeiten, Aufgaben, Tonalität und Wissensbasis individuell zu konfigurieren. Kollaboration Teams können gemeinsam Agenten anpassen, verwalten und sofort in den Arbeitsablauf integrieren. Integration & Veröffentlichung Agenten lassen sich direkt in bestehende Workflows einbinden, für Kunden- oder Mitarbeitersupport einsetzen und sofort veröffentlichen. Plugins (30+ Features) Erweiterungen wie News-Suche, Google-Suche, KI-Bildgenerator oder Dokumentenerstellung können eingebunden werden. Wissensbasis-Anpassung Eigene Daten lassen sich integrieren, sodass Agenten kontextbezogen und unternehmensspezifisch antworten können. Brand Voice Anpassung der Kommunikationsweise der Agenten, um konsistente Markenbotschaften sicherzustellen. Multi-Model-Unterstützung Zugriff auf verschiedene KI-Modelle (z. B. GPT-4, Claude 3, Gemini 1.5), um komplexe Aufgaben zu lösen. Kostenreduktion Automatisierung repetitiver Aufgaben senkt die Betriebskosten und reduziert den Bedarf an zusätzlichen Ressourcen. Flexibilität Plattform passt sich an unterschiedliche Geschäftsanforderungen an und unterstützt vielseitige Use Cases. Produktivitätssteigerung Routineaufgaben werden automatisiert, sodass Teams sich auf wertschöpfende Tätigkeiten konzentrieren können.

Assistant, Automatisierung, Datenbank, Recherche

1 Tool verfügbar

1

Dashworks Bots

Dashworks Bots – KI-Assistenten für Teamfragen und Datenbankzugriff

Dashworks Bots erstellen KI-gesteuerte Assistenten, die Teams in Echtzeit Antworten liefern. Die Bots integrieren sich nahtlos in bestehende Arbeitsabläufe und Datenbanken, um die Suche nach Informationen zu beschleunigen. (https://www.dashworks.ai/)

Assistant, Business-Intelligence, Präsentation

1 Tool verfügbar

1

Monic.AI

Laden Sie beliebiges Lernmaterial hoch, erstellen Sie Zusammenfassungen, Quizfragen und Karteikarten in Sekundenschnelle und üben Sie mit wissenschaftlich erprobten Methoden – alles auf einer leistung

Quiz-Ersteller Erstellen Sie mühelos Quizfragen aus Ihren Lernmaterialien, um Ihr Wissen zu testen und wichtige Konzepte mit Leichtigkeit zu festigen. Intelligente Übungsmodi Testen Sie sich selbst mit forschungsbasierten Übungsmodi wie räumlicher Wiederholung, zeitgesteuerten Prüfungssimulationen und mehr. Zusammenfassungs-Generator Fassen Sie Lernmaterialien einfach in Zusammenfassungen zusammen, um effiziente Überprüfungen durchzuführen und komplexe Themen besser zu verstehen. Chatten mit Dateien Chatten Sie mit jeder Datei mithilfe fortschrittlicher KI, um Konzepte zu klären, Themen zu diskutieren und Ihr Lernen intuitiv zu verbessern. Karteikarten-Ersteller Verwandeln Sie Lernmaterialien schnell in Karteikarten, um Ihre Wiederholungssitzungen zu optimieren und die Merkfähigkeit zu verbessern. KI-Tutor Holen Sie sich mit AI Tutor personalisierte Lernunterstützung für maßgeschneiderte Erklärungen und Anleitungen, die bei der Bewältigung schwieriger Themen helfen.

Assistant, Sprache

2 Tools verfügbar

2

Ginger AI

Ginger AI – Intelligenter Schreibassistent für fehlerfreie Texte

Ginger AI prüft Texte auf Grammatik- und Rechtschreibfehler, gibt stilistische Vorschläge und verbessert die Ausdrucksweise. Die KI kann außerdem Synonyme empfehlen und hilft, Inhalte präzise zu formulieren. (https://www.ginger-ai.com/)

Speechy

Transkribieren, Aufnehmen, Teilen Speechy transkribiert Ihre Worte und Gedanken mühelos und hilft Ihnen, in kürzerer Zeit mehr zu erreichen!

Mit Speechy werden Ihre Worte magisch in Text umgewandelt, ohne dass Sie jemals eine Tastatur berühren müssen. Sparen Sie sich Stunden von wiederholtem Stress, Ellbogen- und Handgelenksverletzungen, die durch endloses und mühsames Tippen verursacht werden. Jetzt können Sie die Kraft Ihrer Stimme nutzen, um Ihre Worte zu erstellen! Es hilft auch bei der Ausspracheübung beim Erlernen von Fremdsprachen und bei Besprechungsprotokollen. Speechy transkribiert nicht nur Ihre Worte, sondern zeichnet auch Ihre STIMME auf, damit Sie später auf die Originalaufnahme zurückgreifen können! Außerdem können Sie Ihre Text- und Audiodateien später leicht teilen! (Funktioniert mit Evernote, Dropbox, Google Drive, OneDrive, Facebook, Twitter, Snapchat, WhatsApp und anderen von iOS unterstützten Sharing-Apps.) Ob Sie ein professioneller Schriftsteller, Arzt, Anwalt, behindert oder irgendwie am traditionellen Tippen gehindert sind, Speechy wird Ihre Transkriptionsprobleme schnell lösen und Ihnen helfen, Ihre Schreibziele heute zu erreichen! Und Speechy hört hier nicht auf! Speechy ist global ausgerichtet und erkennt nicht nur Ihre Muttersprache (derzeit werden mehr als 88 Sprachen unterstützt, Tendenz steigend), sondern ÜBERSETZT auch Ihre diktierten Texte in andere Sprachen! Egal, wo auf der Welt Sie sich befinden oder mit wem Sie kommunizieren müssen, Speechy wird Ihnen dabei helfen!

Assistant, Video, Character

1 Tool verfügbar

1

Heygen

HeyGen ist eine Plattform zur Erstellung realistischer KI-Avatar-Videos in Minuten. Du wählst aus fertigen Avataren, erstellst mit rund zwei Minuten Aufnahme-Material einen persönlichen Digital Twin oder arbeitest mit Interactive Streaming Avatars in Echtzeit. Herzstück ist Avatar IV (seit 2025), dessen Audio-zu-Ausdruck-Engine Tonfall, Rhythmus und Emotion in Mimik, Kopfbewegung und Gesten überträgt. Der integrierte Video Translator übersetzt Videos inklusive Lippensynchronisation in über 175 Sprachen und Dialekten.

Was du mit HeyGen machen kannst: Text-zu-Video mit Avatar – fertige Avatare oder eigene Digital Twins ein Skript vorlesen lassen; in Minuten ein komplettes Video ohne Kamera oder Studio. Avatar IV – Audio-zu-Ausdruck-Engine erzeugt feine Mikro-Expressionen, natürliche Kopfbewegung und skriptsynchrone Gesten aus der Tonspur. Digital Twin – aus rund zwei Minuten Aufnahme-Material einen persönlichen Klon erzeugen, der anschließend beliebige Skripte in der eigenen Stimme und Optik spricht. Video-Übersetzung in 175+ Sprachen – Clips automatisch synchronisieren und dubben, mit Voice Cloning, passender Lippensynchronisation und Untertiteln. Regionale Dialekte – die Translate-Funktion unterscheidet z. B. Schweizerdeutsch von Hochdeutsch und erhält den ursprünglichen Stimmcharakter. Voice Director und Voice Mirroring – Betonungen, Pausen und Emotionen gezielt steuern, damit die KI-Stimme natürlich wirkt. Interactive Streaming Avatars – Live-Agenten für TikTok oder Twitch, die 24/7 in Echtzeit auf Kommentare antworten; integrierbar über die HeyGen-API. Vorlagen und Szenen – Templates und fertige Szenen für Marketing-Clips, Produktvideos, Trainings oder Social-Media-Formate. Personalisierte Videos – massenhaft individualisierte Clips mit Namen, Zahlen oder Sprache pro Empfänger erzeugen. API-Integration – Videogenerierung in eigene Tools oder Workflows einbinden, z. B. für Support-Bots, Vertriebsvideos oder Schulungen. Hinweis: HeyGen ist kreditbasiert; je nach Tarif stehen unterschiedliche Minuten, Avatare und API-Kontingente zur Verfügung.

Automatisierung

6 Tools verfügbar

6

Browse.AI

Browse.AI – KI-gestützte Web-Datenextraktion und Monitoring

Browse.AI extrahiert Daten von beliebigen Websites und überwacht Veränderungen in Echtzeit. Nutzer können strukturierte Datensätze erhalten und sich bei Updates benachrichtigen lassen. (https://www.browse.ai/)

Datamotto

Datamotto – KI-gestützte Datenvorverarbeitung und -anreicherung

Datamotto übernimmt die Bereinigung, Anreicherung und Transformation von Rohdaten. Das Tool füllt fehlende Werte auf, kategorisiert Textspalten oder führt Feature-Engineering durch, um Analysen zu erleichtern. (https://datamotto.com/)

Glitter.AI

Glitter.AI – KI-Tool zur Prozessbeschreibung und -automatisierung

Glitter.AI wandelt Beschreibungen von Prozessen in strukturierte Schritt-für-Schritt-Anleitungen um. Dadurch lassen sich Arbeitsabläufe vereinfachen und automatisieren, ohne komplexe Programmierkenntnisse. (https://www.glitter.io/)

Numerous.ai

Numerous.ai – KI-Assistent für Excel und Google Sheets

Numerous.ai generiert Formeln, erstellt Texte für mehrere Zeilen und passt Daten an. Das Tool funktioniert sowohl mit Google Sheets als auch Excel, um repetitive Aufgaben zu automatisieren und Datenauswertungen zu beschleunigen. (https://numerous.ai/)

Questflow

Questflow – Plattform für plattformübergreifende Workflow-Automatisierung

Questflow ermöglicht kollaboratives „Text-to-Workflow“ und verbindet verschiedene Apps miteinander. So lassen sich E-Mails, Kalender, Datenbanken oder Social-Media-Tools automatisiert steuern. (https://www.questflow.ai/)

Recall

Recall – KI-gestütztes Tool zur automatischen Sammlung und Zusammenfassung von Online-Inhalten

Recall sammelt beliebige Webinhalte und ordnet sie automatisch in einer Wissensbasis. Die KI verknüpft Themen und erstellt Zusammenfassungen, um Informationen schnell wiederzufinden. (https://www.getrecall.ai/)

Automatisierung, Assistant, Programmieren

2 Tools verfügbar

2

Azna AI

45 Tools verfügbar

45

Adobe Express

Adobe Express ist Adobes All-in-One-Designplattform für Social Media, Marketing und Präsentationen. Das Tool kombiniert Drag-and-Drop-Bearbeitung, riesige Vorlagenbibliotheken und Adobe-Stock-Assets mit den generativen Firefly-Modellen. Seit April 2026 ist der Firefly AI Assistant integriert – ein Creative Agent, der komplexe mehrstufige Workflows nach Textprompt ausführt und dabei nahtlos mit Photoshop, Premiere, Lightroom und Illustrator zusammenspielt. Zielgruppe sind Einsteiger, Social-Media-Creator und kleine Unternehmen. Adobe-Konto erforderlich.

Was du mit Adobe Express machen kannst: Vorlagenbibliothek – Tausende anpassbare Templates für Flyer, Social Posts, Reels, mehrseitige Präsentationen und Videos. Drag-and-Drop-Editor – Texte animieren, Hintergründe entfernen, Formate und Farben intuitiv anpassen. Firefly-Integration – KI-generierte Bilder, Textstile und Effekte direkt im Editor erzeugen; aktuell über 30 verschiedene Firefly-Modelle verfügbar. Firefly AI Assistant (seit April 2026) – ein Creative Agent beschreibt deine Zielwirkung und führt mehrstufige Workflows über Firefly, Express, Photoshop, Premiere, Lightroom und Illustrator aus. Creative Skills – kuratierte Mini-Workflows, die sich per Prompt starten und an den eigenen Stil anpassen lassen. KI-Videoerstellung – Clips generieren und bearbeiten, mit studiotauglicher Audio-Spur, Farbkontrollen und präzisen Bildanpassungen. Brand Kits – Markenfarben, Schriften und Logos zentral hinterlegen und Designs mit einem Klick an den Brand anpassen. Adobe Stock und Fonts – direkter Zugriff auf 25.000+ Adobe Fonts, hunderttausende Stock-Medien und Musik-Tracks ohne Extra-Login. Plattform-Export – fertige Inhalte im passenden Format für Instagram, TikTok, YouTube, LinkedIn oder Print exportieren. Teamfreigaben – Entwürfe mit Kollegen oder Kunden teilen, kommentieren und gemeinsam weiterentwickeln. Hinweis: Es gibt eine kostenlose Einstiegsversion; der Premium-Plan schaltet erweiterte Firefly-Credits, Brand-Kits, Premium-Templates und Team-Funktionen frei.

Adobe Stardust

Adobe Stardust – KI-basiertes Fotobearbeitungs- und Objekterkennungstool

Projekt Stardust erkennt Objekte in Bildern automatisch und ermöglicht das Verschieben, Löschen oder Verändern einzelner Elemente. Auch Personen lassen sich aus dem Hintergrund entfernen oder Kleidung anpassen. Aktuell noch in der Beta-Phase. (https://www.theverge.com/2023/10/5/23904416/adobe-max-sneak-project-stardust-ai-photo-editing-tool)

Akool

Akool – All-in-one KI-Plattform für Bildbearbeitung und Avatarerstellung

Akool bietet verschiedene Tools zur Generierung und Bearbeitung von Bildern, Avataren und Hintergründen. Zudem lassen sich Gesichter verändern und Videos in anderen Sprachen vertonen. (https://content.akool.com/tools)

Blend.AI

Blend.AI – KI-gestützte Produktfotoerstellung

Blend.AI spezialisiert sich auf die schnelle und professionelle Erstellung von Produktfotos. Mithilfe hochentwickelter Algorithmen lassen sich Größe, Hintergrund, Beleuchtung und andere Details flexibel anpassen. Fotos können hochgeladen, retuschiert und in Sekunden in eindrucksvolle Produktbilder umgewandelt werden. (https://www.blendnow.com/)

Canva Dream Lab

Canva Dream Lab – KI-basierte Bildgenerierung als Teil der Canva-Suite

Dream Lab ist ein Feature innerhalb von Canva, das per KI aus Textvorgaben Bilder in verschiedenen Stilen erstellt. Nutzer können diese Grafiken direkt in ihre Designprojekte integrieren. (https://www.canva.com/ai-image-generator)

Chatbot Arena

Chatbot Arena (Bildvergleich) – Plattform zum Testen von KI-Bildausgaben

Diese Variante der Chatbot Arena fokussiert sich auf die Gegenüberstellung von Bildausgaben verschiedener KI-Modelle. Nutzer können Prompts eingeben und die generierten Bilder direkt vergleichen. (https://lmarena.ai/)

ChatDesigner

ChatDesigner – KI-Werkzeug für Stockfotos, Porträts und Logoerstellung

ChatDesigner hilft Nutzern, Stockfotos und AI-Porträts zu generieren und Bilder zu bearbeiten. Darüber hinaus können Logos gestaltet werden. Das Tool funktioniert per Texteingabe und liefert zügig kreative Ergebnisse. (https://chatdesigner.ai/)

Cleanup Pictures

Cleanup.pictures ist ein browserbasiertes KI-Tool zum Entfernen von Personen, Objekten, Text oder Defekten aus Bildern. Anders als klassische Clone-Werkzeuge rekonstruiert die KI selbstständig, was hinter dem markierten Bereich vermutlich zu sehen war. Das Web-Tool läuft ohne Installation, ohne Anmeldung und ist in der Grundversion kostenlos; der Pro-Tarif schaltet hochauflösende Ausgabe frei.

Was du mit Cleanup.pictures machen kannst: Objekte entfernen – Personen, Fahrzeuge oder Gegenstände einfach mit dem Pinsel markieren; die KI ersetzt den Bereich durch einen plausiblen Hintergrund. Text und Wasserzeichen entfernen – störende Schriftzüge, Logos oder Stempel aus Bildern tilgen, ohne sichtbare Kanten. Defekte retuschieren – Kratzer, Staubpartikel oder Bildstörungen in gescannten Fotos entfernen. Inhaltsbasierte Füllung – anders als Clone-Tools braucht die KI keinen Referenzbereich; sie rät aus dem Kontext, was fehlen sollte. Browserbasiert – läuft direkt im Web ohne Installation oder Login, mit Drag-and-Drop-Upload. Datenschutz – Bilder werden für die Verarbeitung kurzzeitig hochgeladen, sodass keine Daten lokal verbleiben. Hinweis: Die kostenlose Version exportiert bis 720 Pixel Kantenlänge. Der Pro-Plan (ca. 5 USD pro Monat oder 36 USD pro Jahr) hebt die Größenbeschränkung auf und liefert bessere Qualität bei hochauflösenden Bildern.

Clipdrop

Clipdrop – KI-gestützte Tools für Bildbearbeitung und Text-zu-Bild

Clipdrop bietet eine Palette von KI-Funktionen wie Text-to-Image, Bilderweiterung, Cleanup oder Hintergrundentfernung. Nutzer können Objekte austauschen, Schrift entfernen und Beleuchtung anpassen. (https://clipdrop.co/tools)

CM3Leon

CM3Leon – Metas KI-Modell für Text-zu-Bild, Bildbearbeitung und Bildbeschreibung

CM3Leon ist ein von Meta entwickeltes KI-Modell, das nicht nur Bilder aus Text generiert, sondern auch bestehende Bilder bearbeiten und beschreiben kann. Es basiert auf einem Transformer-Ansatz statt klassischer Diffusion, wodurch es schneller und ressourcenschonender ist. (https://ai.meta.com/blog/generative-ai-text-images-cm3leon/)

Craiyon

Craiyon – Kostenloser KI-Bildgenerator mit einfacher Texteingabe

Craiyon erstellt aus Textbefehlen kleine 256×256-Bilder. Ohne Anmeldung nutzbar, eignet es sich zum schnellen Testen von KI-Bildideen. Größere Auflösungen sind in der kostenpflichtigen Version verfügbar. (https://www.craiyon.com/)

Dall-E

DALL-E – KI-gestützter Bildgenerator

DALL-E ist ein KI-basiertes Tool zur Bilderzeugung, das aus rein textbasierten Eingaben eigenständig kreative und realistische Motive generiert. Die Anwendung unterstützt vielfältige Stile – von einfachen Zeichnungen bis hin zu fotorealistischen Kompositionen – und ermöglicht Nutzern, durch kurze Beschreibungen schnell individuelle Bilder zu erstellen. Mit Hilfe modernster Deep-Learning-Algorithmen interpretiert DALL-E Begriffe, Szenen und Objekte, um originelle Resultate zu liefern, die sich für künstlerische, werbliche oder pädagogische Zwecke eignen. (https://labs.openai.com/)

Dall-E3

DALL·E 3 – KI-basiertes Tool zur Bildgenerierung

DALL·E 3 ist die neueste Generation des textgesteuerten Bildgenerators von OpenAI. Es produziert detailreiche und kreative Motive und ist eng in GPT-4 integriert, um nahtlos zwischen Text- und Bildinhalten zu wechseln. (https://www.openai.com/)

DragGAN

DragGAN – Punktgenaue KI-Bildbearbeitung

DragGAN ermöglicht das gezielte Verformen und Bearbeiten von Bildern, indem Objekte oder Bildbereiche interaktiv gezogen werden. Pose, Form und Ausdruck können präzise angepasst werden, was neue Freiheiten in der Bildmanipulation eröffnet. (https://vcai.mpi-inf.mpg.de/projects/DragGAN/)

Draw3D

Draw3D – KI-Tool zur Umwandlung von Skizzen in fotorealistische Bilder

Draw3D konvertiert handgezeichnete Skizzen oder einfache Zeichnungen in fotorealistische Darstellungen. Nutzer können beliebig viele Details hinzufügen, von Landschaften bis hin zu komplexen Szenen. (https://draw3d.online/)

Fluid by DeepMind

Fluid by DeepMind – Hochwertiges KI-Text-zu-Bild-Modell mit kontinuierlichen Tokens

Fluid von Google DeepMind erzeugt hochqualitative Bilder mithilfe eines kontinuierlichen Token-Ansatzes. Das Modell verspricht mehr Details und Farbtreue im Vergleich zu herkömmlichen Text-zu-Bild-Systemen. (https://arxiv.org/abs/2410.13863)

FLUX Forest Lab

Black Forest Labs (bfl.ai) ist ein deutsches KI-Forschungsunternehmen und Hersteller der FLUX-Modellfamilie zur Bildgenerierung. Aktuelles Flaggschiff ist FLUX.2 (seit November 2025), ergänzt um die extrem schnellen FLUX.2 [klein]-Varianten (Januar 2026) und das Spitzenmodell FLUX.2 [max]. Die Modelle liefern photorealistische Ausgaben bis 4 Megapixel, präzise Typografie, markentreue Farben per Hex-Code und konsistente Figuren über mehrere Bilder hinweg. Nutzung über API, Open Weights (zum Selbstbetrieb), Enterprise-Pakete oder den Browser-Playground.

Was du mit Black Forest Labs / FLUX machen kannst: FLUX.2-Modellfamilie – Pro, Flex, Dev, das Apache-2.0-lizenzierte Klein und FLUX.2 [max] als Spitzenmodell für maximale Qualität und Kontrolle. Photorealistische Bilder – Ausgabe bis 4 Megapixel mit realistischer Lichtführung und Physik, ohne typischen "AI-Look". Multi-Reference-Feature – viele Varianten eines Bildes aus mehreren Referenzen, mit stabiler Typografie und konsistenter Bildsprache. Brand-Farben per Hex-Code – exakte Markenfarben ohne Approximation; eignet sich für UI-Mockups und Markenassets. Charakter-Konsistenz (FLUX.2 [max]) – Gesichter, Proportionen, Mimik und visuelle Identität bleiben über Szenen, Posen und Stile hinweg erhalten. Open Weights – Modelle herunterladen und auf eigener Hardware betreiben; ideal für datensensible Anwendungen oder Fine-Tuning. API-Zugang – skalierbare Produktions-API für Integration in eigene Apps und Workflows. Playground – Browser-Editor, in dem du FLUX-Modelle ohne Installation testen und Bilder direkt generieren oder transformieren kannst; mit Presets wie Kontext-Komposer. NVIDIA-Optimierung – FP8-Quantisierung reduziert den VRAM-Bedarf um rund 40 %, sodass FLUX.2 auch auf kleineren RTX-GPUs lokal läuft. Enterprise-Lösungen – anpassbare Lizenzen, technischer Support und skalierbare Infrastruktur für große Unternehmen. Dashboard – zentrale Verwaltung von API-Schlüsseln, Nutzung und Abrechnung. Hinweis: FLUX 1 ist weiterhin als Legacy-Version verfügbar; produktiv empfiehlt sich FLUX.2. Preise und Kontingente variieren je nach API-Plan oder Open-Weights-Nutzung.

Fotor

Fotor – Umfassendes KI-Bildbearbeitungstool

Fotor bietet Bildbearbeitungsfunktionen für Anfänger und Profis, darunter Retusche, Filter, Text- und Sticker-Einbindung sowie automatisierte KI-Funktionen. Nutzer können Grafiken für Social Media, Werbung oder persönliche Projekte erstellen. (https://www.fotor.com/)

GenMo

GenMo – KI-basierte Bilderzeugung und Animation

GenMo kann Bilder per Texteingabe erstellen, 3D-Meshes und 360-Grad-Videos generieren sowie hochgeladene Bilder animieren. Nutzer können sogar komplette Filmskripte verfassen und Trailer automatisch erzeugen lassen. (https://www.genmo.ai/)

Gliff.App

Glif ist eine No-Code-Plattform, auf der du visuell Mini-Apps und KI-Agenten ("Glifs") zusammenklickst. Per Block- und Node-Editor verkettest du Prompts, Tools und Medienmodelle zu Workflows – etwa Text-zu-Bild, Text-zu-Video, Meme-Generatoren, Chatbots oder ganze kleine Browser-Spiele. Im Hintergrund wählt die Plattform das passende Modell aus einer breiten Auswahl (OpenAI, Anthropic, Gemini, DeepSeek, Flux, Runway, Kling, ElevenLabs u. a.). Die Nutzung ist kreditbasiert: Konto aufladen und loslegen.

Was du mit Glif machen kannst: Visueller Workflow-Builder – per Drag-and-Drop Nodes und Blöcke verketten (Text-zu-Bild, Bild-zu-Video, API-Calls, Logik) und daraus eine ausführbare Mini-App bauen. KI-Agenten – spezialisierte Agenten, die Aufgaben selbstständig ausführen, von Text- und Code-Generierung über Medien-Produktion bis zu ganzen Kampagnen. Video-Generierung – Anbindung moderner Videomodelle (Veo, Kling, Runway) für Clips, Social-Video oder visuelle Konzepte. Bild-Generierung – Zugriff auf Flux und weitere Bildmodelle direkt aus dem Workflow heraus. Audio-Generierung – Stimmen, Sounds und Musik über ElevenLabs und ähnliche Modelle. Code- und App-Generierung – Agenten schreiben Code und erzeugen kleine interaktive Browser-Apps wie MicroTetris, MicroRPG oder GameOfLife-Varianten. Social-Media-Content – Glifs für Meme-Posts, Thumbnails und Kampagnen produzieren. Prompt Chaining – mehrere Modelle und Schritte hintereinander schalten, damit ein Agent Idee → Modellwahl → Inhalt → Kuration in einem Durchlauf erledigt. Themes und Branding – eigene Oberflächen für Glifs gestalten, um sie als Produkt oder mit eigenem Branding zu veröffentlichen. Integrationen – externe APIs, MCP-Server (Glif stellt einen eigenen MCP-Server bereit) und Tools an Workflows anbinden. Community und Remix – fertige Glifs anderer Nutzer entdecken, forken und an eigene Anwendungsfälle anpassen. No-Code-Agent-Builder – eigene Agenten ohne Programmierkenntnisse bauen, testen und teilen. Dokumentation und API – Guides, API-Docs und Changelog für Entwickler, die Glifs in eigene Produkte einbinden. Hinweis: Die Plattform arbeitet kreditbasiert; die Preise richten sich nach den verwendeten Modellen und der Ausführungszeit.

Ideogram

Ideogram ist eine KI-Bildgenerierungsplattform mit einem klaren Schwerpunkt: korrekt gesetzter, sauber integrierter Text im Bild. Mit Ideogram 3.0 und den API-Modellen Flash und Turbo liefert das Tool photorealistische bis künstlerische Motive, in denen auch längere Phrasen, geschwungene Schriftführung und mehrzeilige Layouts verlässlich stimmen. Zielgruppe sind Designer, Marketer und Creator, die Poster, Logos, T-Shirt-Grafiken, Social-Media-Assets oder Produktvisualisierungen in Serie brauchen.

Was du mit Ideogram machen kannst: KI-Bildgenerierung – Motive aus Textprompts erzeugen, von photorealistisch bis illustrativ, mit realistischer Beleuchtung, Texturen und Tiefe. Text-Rendering – zuverlässige Schrift in Bildern mit hoher Trefferquote bei Rechtschreibung; mehrzeiliger Text, gekrümmte Pfade und gemischte Schnitte sind machbar. Magic Prompt – erweitert kurze Eingaben automatisch zu detaillierten Prompts; hilfreich für Einsteiger und für kreative Varianten. Describe – erzeugt aus einem vorhandenen Bild einen detaillierten Textprompt, den du direkt weiterverwenden kannst. Style Reference – bis zu drei Referenzbilder hochladen, um Farbe, Stimmung und Stil eines Motivs zu übertragen. Style Codes – gefundene Stile als Code speichern, um sie konsistent für Kampagnen oder Marken wieder einzusetzen. Canvas-Editor – generierte Bilder weiter bearbeiten, Elemente hinzufügen oder entfernen, Varianten erzeugen. Batch-Generierung – viele Bilder parallel für A/B-Tests oder Serien erzeugen. Explore-Feed – Community-Galerie mit Filtern wie People, Product, Nature, Poster, Logo oder T-Shirt; Prompts anderer Creator nachschlagen und remixen. Bibliothek und Collections – eigene Bilder, Favoriten und thematische Sammlungen zentral verwalten. Stile, Elemente und Charaktere – vorgefertigte Style- und Element-Bibliotheken für konsistente Designs und wiedererkennbare Figuren. Ideogram API – Flash- und Turbo-Modelle für produktive Integrationen in eigene Workflows und Apps. Hinweis: Der Free-Plan liefert regelmäßig erneuerte "slow credits" für kostenlose Einstieg. Bezahlpläne schalten schnellere Generierung, höhere Kontingente und kommerzielle Rechte frei.

Idogram Version 2

Ideogram Version 2 – KI-gestützte Bildgenerierung mit verbesserter Qualität und Farbpaletten

Ideogram Version 2 liefert noch realistischere und detailreichere Bilder. Neue Optionen erlauben die Auswahl einer Farbpalette und unterschiedlicher Stile, etwa Realismus oder Design. (https://ideogram.ai/t/explore)

Image App

ImageApp – Multi-KI-Plattform zur Bildgenerierung

ImageApp bündelt verschiedene KI-Modelle wie DALL-E, Stable Diffusion oder Openjourney. Nutzer können gleichzeitig mehrere Bildgeneratoren ansteuern, um das jeweils beste oder kreativste Ergebnis zu erhalten. (https://imageapp.xyz/)

Imageupscaler

ImageUpscaler – KI-gestützte Bildverbesserung und Skalierung

ImageUpscaler.ai vergrößert Fotos, Cartoons und weitere Bildtypen mithilfe künstlicher Intelligenz. Dabei werden Auflösung und Qualität optimiert, um gestochen scharfe Ergebnisse für Druck, Web oder Design zu erzielen. (https://imageupscalerai.com/)

Krea Ai

Krea AI – Automatisierte Designlösung für professionelle Grafiken

Krea AI richtet sich an Marketingteams, Freelancer und Startups, die schnell professionellen visuellen Content erstellen möchten. Die Plattform generiert Layouts und Designs ohne tiefgehende Vorkenntnisse im Grafikbereich. (https://www.krea.ai/apps/image/realtime)

LeiaPix

LeiaPix – KI-basierte Umwandlung von 2D-Bildern in 3D

LeiaPix ermöglicht das Hochladen von 2D-Bildern und konvertiert sie mithilfe fortschrittlicher KI-Technologie in dynamische 3D-Bilder. So entstehen visuell ansprechende Inhalte für Marketing, Bildung und Unterhaltung. (https://convert.leiapix.com/)

Leonardo

Leonardo.ai ist eine KI-Kreativplattform für Bild- und Videogenerierung, die sich 2026 deutlich weiterentwickelt hat: Das hauseigene Phoenix-Modell in Kombination mit der Alchemy-v4-Pipeline liefert photorealistische Bilder mit präziser Prompt-Treue und stimmigem Text im Bild. Ergänzt wird das Ganze durch den Realtime Canvas für interaktives Zeichnen mit Echtzeit-Rendering und Motion v3 für 10-Sekunden-HD-Videoclips mit Kamerakontrolle. Zielgruppe sind Designer, Game-Artists, Marketer und Creator, die in Serie hochwertige Visuals brauchen.

Was du mit Leonardo.ai machen kannst: Bildgenerierung mit Phoenix – Leonardos Flaggschiff-Modell erzeugt Motive mit Hyper-Realismus oder abstrakter Komposition und kohärent gesetztem Text im Bild. Alchemy v4 – erweiterte Generierungspipeline für höhere Qualität, bessere Prompt-Treue und mehr Konsistenz als frühere Stable-Diffusion-Varianten. Vielfältige Stilmodelle – diverse Vorlagen- und Fine-Tune-Modelle für realistische Fotografie, Concept Art, Game Assets, Anime und illustrative Looks. Realtime Canvas – interaktives Zeichenbrett, das während des Malens oder Skizzierens in Echtzeit (sub-sekunden) ein KI-Bild rendert und an Pinselstrichen angepasst aktualisiert. Motion v3 – 10-Sekunden-HD-Videoclips aus einem Einzelbild oder Textprompt, inklusive Kamerabewegungen wie Pan, Zoom und Parallax. 3D-Textur-Synthese – passende Texturen für 3D-Meshes direkt aus Prompts generieren. Prompt-Generator und -Bibliothek – Vorschläge, Magic-Prompt-Funktionen und Sammlungen erfolgreicher Prompts zum Weiterentwickeln. Canvas-Editor – generierte Bilder mit Inpainting, Outpainting und Maskenkorrekturen nachbearbeiten. Community und Feed – öffentliche Galerie mit Bildern anderer Nutzer, Prompts und remixbaren Generationen. Training eigener Modelle – eigene Fine-Tunes mit wenigen Referenzbildern trainieren (z. B. für einen Charakter oder einen Markenstil). API-Zugang – Generierungs-API zur Integration in eigene Tools, Pipelines oder Spielentwicklungs-Workflows. Hinweis: Leonardo bietet einen kostenlosen Token-Pool pro Tag. Bezahlpläne schalten höhere Kontingente, Motion, schnellere Generierung und kommerzielle Rechte frei.

Leonardo Live Canvas

Leonardo Live Canvas (Realtime Canvas) ist ein Echtzeit-Zeichenbrett von Leonardo.ai, das während des Malens oder Skizzierens fortlaufend ein KI-Bild rendert. Der Rückkanal arbeitet im Sub-Sekunden-Bereich, sodass aus einfachen Linien in wenigen Strichen eine photorealistische oder illustrative Szene entsteht. Ideal für schnelle Ideation, Moodboards, Concept-Sketches und Look-Development; das Motiv passt sich kontinuierlich an Pinselstriche, Formen und den Prompt an.

Was du mit Leonardo Live Canvas machen kannst: Echtzeit-Rendering – deine Skizze wird sofort als fertiges KI-Bild dargestellt und mit jedem Pinselstrich aktualisiert. Prompt plus Skizze – Textprompt definiert Stil, Thema und Stimmung; die Skizze bestimmt Komposition und Formen. Modellwahl – verschiedene Basismodelle für photorealistisch, illustrativ, Anime oder Concept-Art-Looks. Sub-sekündlicher Feedback-Loop – ideal für Look-Entwicklung, Moodboards und schnelles Iterieren von Ideen. Brush- und Maskenwerkzeuge – Bereiche gezielt erweitern, auslöschen oder überlagern, um das Ergebnis zu führen. Stärke des KI-Einflusses einstellen – regelbar, wie stark die KI die Skizze interpretiert oder am Original festhält. Übergabe in andere Leonardo-Tools – erzeugte Canvas-Bilder direkt in den Image-Editor, Motion v3 (Videoanimation) oder eine Batch-Generierung weiterreichen. Hinweis: Live Canvas ist Teil von Leonardo.ai; für die Nutzung ist eine Leonardo-Anmeldung nötig. Kostenpflichtige Pläne bieten höhere Kontingente und Zugriff auf Premium-Modelle.

Letz.AI

Letz.AI – KI-Plattform für personalisierte Bildgenerierung und Avatare

Letz.AI generiert personalisierte Bilder, indem es „Klone“ von Personen oder Produkten als AI-Modelle erstellt. Nutzer können ihr eigenes Porträt oder Produkt hochladen und unterschiedliche Stile, Hintergründe oder Szenarien ausprobieren. (https://letz.ai/)

Lexica

Lexica ist eine Kombination aus KI-Bildsuche und Generator. Über die öffentliche Galerie durchsuchst du Millionen KI-Bilder nach Stichwörtern oder per Bildähnlichkeit – inklusive sichtbarer Prompts und Parameter zum Kopieren. Mit dem hauseigenen Modell Aperture (aktuell v5) erzeugst du eigene Motive; das Modell ist bekannt für saubere Kompositionen, weiche Details und stilistische Vielseitigkeit. Lexica eignet sich besonders zum Prompt-Lernen und schnellen Ideenfinden.

Was du mit Lexica machen kannst: Prompt-Suche – Millionen öffentlich geteilte KI-Bilder per Textsuche durchsuchen und den exakten Prompt inklusive Modell, Steps und Parametern einsehen. Bildähnlichkeitssuche – ein Bild hochladen und optisch ähnliche Motive und zugehörige Prompts finden. Aperture v5 – Lexicas eigenes Bildmodell für eigene Generierungen; saubere Kompositionen, weiche Details, verschiedene Stile. Prompt-Reuse – gefundene Prompts per Klick übernehmen, anpassen und direkt zur Grundlage für eine neue Generierung machen. Stil- und Lichtvarianten – Stilvorlagen, Lichtstimmungen und Auflösungen aus dem Generator-Dialog wählen. Verlauf und Likes – eigene Generierungen im Verlauf behalten und Inspiration in einer Favoritenliste sammeln. Prompt-Bibliothek als Lernquelle – Einsteiger sehen, wie erfahrene Creator komplexe Motive beschreiben, und kopieren die Techniken. Hinweis: Browsen der Galerie ist kostenlos. Für eigene Generierungen mit Aperture ist ein kostenpflichtiges Abo nötig; höhere Pläne bringen mehr Credits, parallele Jobs und kommerzielle Rechte.

Midjourney

Midjourney – KI-gestützter Bildgenerator für fotorealistische Darstellungen

Midjourney ist eine KI-gestützte Bildgenerierungsanwendung, die sich auf fotorealistische Darstellungen durch beschreibende Texteingaben spezialisiert hat. Nutzer interagieren in der Regel über Discord, wo sie kurze Befehle oder ausführliche Textprompts eingeben, um detailreiche und künstlerisch anspruchsvolle Bilder zu erstellen. Die Anwendung bietet umfangreiche Stiloptionen und nutzt fortschrittliche Algorithmen, um Szenen, Charaktere und Objekte lebensecht abzubilden. So entstehen hochqualitative Ergebnisse, die in Design, Kunstprojekten oder Marketingkampagnen zum Einsatz kommen können. (https://discord.com/channels/662267976984297473/952771221915840552)

Midjourney Web

Midjourney Web – Browserbasierte KI-Bildgenerierung

Midjourney Web ermöglicht das Erstellen fotorealistischer oder künstlerischer Bilder ohne Discord. Nutzer erhalten 25 kostenlose Bildgenerierungen und können ihre Prompt-Historie bequem im Browser verwalten. (https://www.midjourney.com/home)

Open AI - ChatGPT Image 2

Stand 22.04.2026: ChatGPT Image 2.0 erzeugt deutlich präzisere, textgenaue und komplexe Bilder, unterstützt flexible Formate, mehrere Sprachen und kann bis zu acht Varianten pro Prompt liefern.

W**Kurzfazit:** **ChatGPT Image 2.0 erzeugt deutlich präzisere, textgenaue und komplexe Bilder, unterstützt flexible Formate, mehrere Sprachen und kann bis zu acht Varianten pro Prompt liefern.** --- ## ? Kurze Zusammenfassung der wichtigsten Funktionen von **ChatGPT Image 2.0** ### **1. Präzisere Umsetzung komplexer Anweisungen** Das Modell setzt detaillierte Prompts wesentlich zuverlässiger um als frühere Versionen. Dazu gehören **korrekte Objektpositionierung**, **präzise Layouts**, **Diagramme**, **UI‑Elemente** und komplexe Bildkompositionen. [COMPUTER BILD](https://www.computerbild.de/artikel/News-Internet-ChatGPT-Images-2.0-verspricht-bessere-KI-Bilder-40891067.html) ### **2. Deutlich bessere Textdarstellung im Bild** Ein großer Durchbruch: **Schrift, Labels, Icons und Beschriftungen** werden sauber und konsistent dargestellt – ein Problem, an dem frühere KI‑Bildmodelle oft scheiterten. Dadurch sind die Ergebnisse **produktionsreif** für Marketing, Präsentationen oder Infografiken. [OnlineMarketing.de](https://onlinemarketing.de/technologie/openai-chatgpt-images-2-0-ki-bildgenerierung) ### **3. Flexible Seitenverhältnisse (3:1 bis 1:3)** Ideal für Social Media, Banner, Präsentationen oder mobile Formate. Das Modell kann mehrere Varianten desselben Motivs in unterschiedlichen Formaten erzeugen. [COMPUTER BILD](https://www.computerbild.de/artikel/News-Internet-ChatGPT-Images-2.0-verspricht-bessere-KI-Bilder-40891067.html) ### **4. Mehrsprachige Bildgenerierung** Image 2.0 kann Texte in **vielen Sprachen** korrekt darstellen – auch komplexe Schriftsysteme wie Japanisch, Koreanisch oder Chinesisch. [ifun.de](https://www.ifun.de/chatgpt-images-2-0-ki-bilder-werden-praeziser-und-vielseitiger-278385/) ### **5. Bis zu acht Bildvarianten pro Anfrage** Pro Prompt können **acht zusammenhängende Bilder** erzeugt werden – ideal für Storyboards, Poster‑Sets oder Multi‑Format‑Kampagnen. [it-daily.net](https://www.it-daily.net/shortnews/openai-stellt-chatgpt-images-2-0-vor) ### **6. „Thinking“-Funktion (für Plus/Pro/Business)** Das Modell kann Aufgaben **schrittweise durchdenken**, recherchieren und mehrere Bildideen planen, bevor es rendert. Dadurch entstehen **konsistentere und kontextuell passendere** Ergebnisse. [it-daily.net](https://www.it-daily.net/shortnews/openai-stellt-chatgpt-images-2-0-vor) ### **7. API‑Zugang (gpt-image-2)** Entwickler können das Modell direkt in eigene Anwendungen integrieren – inklusive Generierung und Bearbeitung von Bildern. [it-daily.net](https://www.it-daily.net/shortnews/openai-stellt-chatgpt-images-2-0-vor) ### **8. Verbesserter Realismus & Stilvielfalt** Image 2.0 erzeugt realistischere Fotos, Comics, Illustrationen und grafische Layouts – inklusive Lichtstimmung, Materialstrukturen und feinen Details. [ifun.de](https://www.ifun.de/chatgpt-images-2-0-ki-bilder-werden-praeziser-und-vielseitiger-278385/)

PhotoGPT.ai

PhotoGPT ist eine KI-basierte Plattform, die als persönlicher „AI-Fotograf“ fungiert. Sie ermöglicht es, aus einfachen Selfies ein individuelles KI-Modell zu trainieren, das anschließend realistische Fotos, Headshots und kreative Szenen generiert. Ziel ist es, professionelle Bilder für Bewerbungen, Social Media, Dating-Profile oder Marketinginhalte schnell und ohne klassisches Fotoshooting zu erstellen.

Funktionsübersicht mit Erklärungen AI Headshot Generator Erstellt professionelle Porträtfotos in Sekunden – perfekt für Lebensläufe, LinkedIn oder Business-Websites. AI Photo Editor Bearbeitet Fotos mit Studioqualität: Objekte entfernen, Hintergründe austauschen, Schatten korrigieren oder Licht anpassen. Persönliches KI-Modell Nutzer können 12–15 Selfies hochladen, um ein privates Modell zu trainieren. Dieses Modell versteht Gesichtszüge, Winkel und Stil und erzeugt konsistent realistische Bilder. Prompt Assistant Hilft bei der Formulierung von Bildideen. Nutzer geben eine Stimmung, Pose oder Szene an, und die KI ergänzt kontextgerechte Vorschläge. AI Image Upscaler Verwandelt Standardbilder in hochauflösende, detailreiche Versionen – ideal für Druck oder professionelle Präsentationen. One-Click Styling mit Presets Vordefinierte Stile (z. B. „cinematisch“, „professionell“, „künstlerisch“) können mit einem Klick auf Bilder angewendet werden. Text-in-Image Fügt Textebenen direkt ins Bild ein – inklusive Schriftarten, Schatten und 3D-Effekten. Nützlich für Poster, Banner oder Social Media Posts. Reference Image Input Nutzer können ein Referenzfoto hochladen, um Stil, Pose oder Kleidung zu steuern. So lassen sich ikonische Looks oder bestimmte Settings nachbilden. Themen-Generatoren Fertige Vorlagen für spezielle Anlässe oder Szenen, z. B. Weihnachten, Met Gala, Burning Man, Studio Ghibli, Cyberpunk, Sportevents oder Lifestyle-Shootings. AI Avatare & Charaktere Erstellung von individuellen Avataren oder Charakteren für Social Media, Gaming oder Branding. Kommerzielle Nutzung Die generierten Bilder können für persönliche oder professionelle Zwecke (z. B. Marketing, Branding) eingesetzt werden. API für Entwickler Entwickler können die Funktionen von PhotoGPT über eine API in eigene Apps integrieren, um Headshots oder Porträts automatisch zu generieren.

Playground.ai

Playground AI – KI-gestützte Bilderzeugung durch Texteingabe

Playground AI erstellt realistische oder künstlerische Bilder allein durch beschreibende Textprompts. Nutzer können verschiedene Stile und Parameter wählen, um Bilder für Designprojekte, Marketing oder private Zwecke zu generieren. (https://playgroundai.com/)

Profile Picture.ai

ProfilePicture.AI – KI-gestützte Profilbild-Erstellung

ProfilePicture.AI ermöglicht es, aus einem hochgeladenen Porträtbild vielfältige Profilbilder in unterschiedlichen Stilen zu generieren. Die KI passt Hintergründe, Farbgebung und Stil an, um ein ansprechendes Ergebnis für soziale Netzwerke oder professionelle Profile zu erzielen. (https://www.profilepicture.ai/)

Prompthero

PromptHero ist eine Such- und Community-Plattform für KI-Prompts. Du durchsuchst Millionen geteilte Prompts und fertige Bilder, gefiltert nach Modell (Stable Diffusion, Midjourney, DALL·E, ChatGPT, Sora), Stil, Thema, Künstler oder Kameratechnik. Die Plattform dient gleichzeitig als Inspirationsquelle, Lernmaterial für Prompt-Engineering und als Marktplatz, auf dem Creator besonders funktionierende Prompts teilen oder verkaufen.

Was du mit PromptHero machen kannst: Prompt-Suchmaschine – Millionen Prompts und zugehörige KI-Bilder nach Stichwort, Thema, Künstlerstil oder Kameratechnik durchsuchen. Modellfilter – Ergebnisse auf bestimmte Modelle wie Midjourney, Stable Diffusion, DALL·E, ChatGPT oder Sora eingrenzen. Prompts kopieren und anpassen – ausgewählte Prompts mit einem Klick übernehmen und in eigenen Tools oder direkt auf der Plattform weiterverwenden. Modell-spezifische Optimierung – eigene Bereiche je KI-Modell; Prompts berücksichtigen Syntax, Modifier und Eigenheiten des jeweiligen Modells. Lernmaterial – Guides und Tutorials zu Prompt-Engineering, Stilmodifikatoren, Negativprompts und Formatierung. Community – eigene Bilder und Prompts teilen, Favoriten sammeln, Diskussionen zu Techniken und Modellversionen verfolgen. Marktplatz – hochwertige Prompts mit Previews und Metadaten zum Verkauf anbieten oder einkaufen. AI-Jobs – angegliederte Stellenbörse mit Ausschreibungen für Prompt Engineering, Generative AI und verwandte Rollen. Eigene Bildgenerierung – direkt auf PromptHero Prompts an Bildmodelle schicken und Varianten erzeugen. Hinweis: Die Suche ist kostenlos. Kostenpflichtige Pläne schalten Premium-Prompts, mehr eigene Generierungen und erweiterte Suchfunktionen frei.

Remove Watermark

WatermarkRemover ist ein browserbasiertes KI-Tool zum Entfernen von Wasserzeichen, Logos, Stempeln und Zeitangaben aus Bildern. Die KI erkennt das Wasserzeichen automatisch und rekonstruiert den Hintergrund, sodass das Bild sauber bleibt. Unterstützt werden gängige Formate wie JPG, PNG, WEBP und HEIC; der Upload läuft per Drag-and-Drop ohne Installation und ohne Registrierung.

Was du mit WatermarkRemover machen kannst: Automatische Wasserzeichen-Erkennung – die KI lokalisiert Logos, Text, Stempel oder Zeitstempel selbst und markiert den zu entfernenden Bereich. Hintergrund-Rekonstruktion – der entfernte Bereich wird durch plausible Bildinhalte ersetzt, ohne sichtbare Kanten oder Unschärfen. Mehrere Formate – Verarbeitung von JPG, JPEG, PNG, WEBP und HEIC-Dateien für gängige Foto- und Screenshot-Workflows. Split-Screen-Vorschau – Original und Ergebnis lassen sich nebeneinander vergleichen, bevor du das bereinigte Bild speicherst. Manuelle Korrektur – einzelne Stellen mit Pinsel oder Lasso nachbearbeiten, falls die automatische Erkennung etwas übersieht. Kein Login erforderlich – der Upload ist direkt im Browser möglich; Bilder werden nach der Verarbeitung zeitnah gelöscht. Mobile und Desktop – funktioniert auf Smartphone, Tablet und Computer, ohne App-Installation. Hinweis: Die Basisnutzung ist kostenlos. Bezahlpläne bieten Batch-Verarbeitung, höhere Auflösungen und kommerzielle Nutzungsrechte. Die rechtliche Verantwortung für das Entfernen von Wasserzeichen bleibt beim Nutzer – nur bei Bildern anwenden, an denen entsprechende Rechte bestehen.

Sana

Sana – KI-Tool zur ultraschnellen Bilderzeugung in 1024×1024

Sana generiert in nur 0,37 Sekunden Bilder mit einer Auflösung von 1024×1024 Pixeln. Ideal für schnelles Prototyping, Social Media oder Marketingkampagnen. (https://ainativefoundation.org/2024/10/18/20241018-sana-itercomp-hallo2-rdt-1b-more/)

SeaArt.AI

SeaArt.AI – KI-gestützte Bilderzeugung mit Vorlagenfunktion

SeaArt.AI erstellt Bilder aus Textprompts und bietet die Möglichkeit, vorhandene Bilder als Vorlage zu nutzen. So können Nutzer Motive anpassen oder neue Varianten generieren. (https://www.seaart.ai/)

Stable Diffusion 3.5

Stable Diffusion 3.5 – Weiterentwickeltes Open-Source-Bildgenerierungsmodell

Stable Diffusion 3.5 liefert noch präzisere Ergebnisse, höhere Auflösung und mehr Vielfalt. Es ist weiterhin frei nutzbar, sowohl kommerziell als auch privat, und eignet sich für zahlreiche Kreativprojekte. (https://stability.ai/)

Stable Dissusion

Stable Diffusion Testcenter – KI-basierte Bildgenerierung mit Version 3

Dieses Testcenter auf Hugging Face zeigt die neuesten Funktionen von Stable Diffusion 3. Nutzer können Prompts ausprobieren, verschiedene Stile testen und sich mit der Community austauschen. (https://huggingface.co/spaces/stabilityai/stable-diffusion-3-medium)

Stablediffusion

Stable Diffusion – Fotorealistischer KI-Bildgenerator

Stable Diffusion ist ein leistungsstarkes KI-Modell zur Generierung fotorealistischer Bilder anhand textbasierter Eingaben. Die Anwendung unterstützt vielfältige Themen und Stile und ermöglicht eine detailreiche Umsetzung von Nutzerideen. Ein kostenloses Kontingent an Bildgenerierungen (z. B. 10 Credits) steht nach Anmeldung zur Verfügung, sodass Nutzer erste Entwürfe direkt testen können. Dank fortschrittlicher Diffusionstechnologie werden hochqualitative Resultate erzeugt, die sich für kreative Projekte, Produktvisualisierungen oder künstlerische Arbeiten eignen. (https://stablediffusionweb.com/)

Tldraw

Tldraw – Interaktive Zeichenoberfläche mit KI-Unterstützung

Tldraw ermöglicht das Erstellen von Zeichnungen oder Wireframes und kann diese mithilfe KI-gestützter Features in professionelle Grafiken verwandeln. Das Tool eignet sich für Brainstorming, Kollaboration und schnelle Visualisierungen. (https://www.tldraw.com/)

Upscale Media

Upscale Media – KI-Tool zur Bildvergrößerung und Qualitätsverbesserung

Upscale Media erhöht die Auflösung von Bildern und verbessert gleichzeitig deren Schärfe und Detailreichtum. So entstehen hochqualitative Ergebnisse für Druck, Web oder Marketing. (https://www.upscale.media/de)

Bilder, Präsentation

3 Tools verfügbar

3

Canva

Canva ist ein browserbasiertes Design-Tool, das sich 2026 zu einer KI-gestützten Kreativ-Suite ausgebaut hat. Unter dem Dach Magic Studio bündelt Canva Bildgenerierung (Dream Lab auf Basis des Leonardo-Phoenix-Modells), Videogenerierung mit Google Veo-3, Datenvisualisierung, interaktive Mini-Apps und eine konversationelle Oberfläche (Canva AI 2.0), die aus Sprache oder Text fertige, bearbeitbare Designs erzeugt. Für Vektorarbeit ist die kürzlich übernommene Affinity-Suite integriert. Zielgruppe sind Einsteiger, Social-Media-Creator, Marketing-Teams und kleine Unternehmen.

Was du mit Canva machen kannst: Vorlagenbibliothek – zehntausende anpassbare Templates für Social Posts, Präsentationen, Poster, Logos, Videos, Websites und Dokumente. Canva AI 2.0 – konversationelle Oberfläche, die per Text- oder Spracheingabe fertige, vollständig bearbeitbare Designs liefert ("Erstelle einen Flyer für eine Pizzeria mit rotem Hintergrund"). Magic Studio – Sammelbegriff für Canvas KI-Tools: Magic Write (Text), Magic Design (Template-Vorschläge), Magic Edit (Objekttausch), Magic Eraser (Entfernen). Dream Lab – hochwertige Bildgenerierung auf Basis des Leonardo-Phoenix-Modells, mit 25 Stilen wie Filmic, Dreamy oder Concept Art. Videogenerierung – Text-zu-Video über Google Veo-3, direkt in den Editor integriert. Drittanbieter-Bildmodelle – DALL·E und Imagen stehen zusätzlich über den Canva App Store zur Wahl. Canva Sheets – Tabellen mit Drag-and-Drop und KI-Auswertung; Formeln können in Alltagssprache formuliert werden. Magic Charts – Daten aus Quellen wie Google Analytics importieren und automatisch in interaktive Diagramme verwandeln. Canva Code – interaktive Inhalte wie Tools, Spiele oder Quizze allein per Textbeschreibung erzeugen, ohne Programmierkenntnisse. Fotoeditor – Hintergründe per Klick austauschen, Objekte verschieben, Gesichter retuschieren, Upscale. Brand Kit – Markenfarben, Logos, Schriften zentral speichern und Designs mit einem Klick markenkonform ausrichten. Team-Zusammenarbeit – Kommentare, Rollen, Freigabe-Workflows und Cloud-Synchronisation für gemeinsame Projekte. Affinity-Integration – Enterprise-Pakete bringen Affinity Designer, Photo und Publisher als Vektor- und Print-Werkzeuge mit Direkt-Sync in Canva. Echtzeit-Credit-Tracker – seit März 2026 zeigt Canva den verbliebenen KI-Credit-Bestand direkt in der App. Hinweis: Canva bietet eine kostenfreie Basisversion. Canva Pro, Teams und Enterprise schalten mehr Templates, Credits, Brand-Features und erweiterte KI-Kontingente frei.

Gamma.app

Gamma.app ist eine KI-Plattform, die aus einem kurzen Textprompt in rund einer Minute fertige Präsentationen, Websites, Dokumente oder Social-Media-Assets generiert. Das Layout nutzt ein modernes kartenbasiertes, scrollbares Format; hinter den Kulissen orchestriert Gamma über 20 KI-Modelle für Text, Bilder und Design-Elemente. Seit Januar 2026 gibt es eine Generate-API für programmatische Erzeugung, dazu Integrationen in 8.000+ Apps über Zapier und Make. Der Free-Plan bietet 400 KI-Credits; bezahlte Stufen (Plus, Pro, Ultra) schalten unbegrenzte Generierung, Custom-Domains, Analytics und Premium-Modelle frei.

Was du mit Gamma.app machen kannst: Präsentationen aus Prompt – aus einer Idee oder einem Briefing in unter 60 Sekunden eine fertige Slide-Struktur mit Texten, Bildern und Layouts erzeugen. Card-basiertes Layout – moderne scrollbare Karten statt klassischer Folien; jede Karte ist gleichzeitig ein Abschnitt für Präsentationen, Websites und Dokumente. Websites bauen – aus demselben Prompt eine vollwertige, gehostete Webseite erzeugen und über eine Custom-Domain ausspielen. Dokumente und One-Pager – strukturierte Berichte, Whitepaper oder Briefings automatisch erzeugen. Social-Media-Assets – plattformgerechte Posts und Grafiken in passenden Formaten generieren. AI Design Agents – On-Brand-Grafiken, Icons und Illustrationen direkt aus dem Editor erstellen. Export in PPT und PDF – finale Decks in klassischen Formaten exportieren, um sie in PowerPoint oder anderen Tools weiterzuverwenden. Generate API (seit Jan 2026) – Präsentationen, Websites und Dokumente programmatisch aus eigenen Systemen heraus erstellen. Integrationen – Zapier- und Make-Anbindung an 8.000+ Apps; direkte Einbettung von Figma, Miro, Airtable, Power BI, YouTube und Typeform. Zusammenarbeit in Echtzeit – Teammitglieder unter "Members" hinzufügen und gleichzeitig am gleichen Dokument arbeiten. Analytics – messen, wie oft ein Deck geöffnet wurde und welche Karten am längsten betrachtet wurden. Hinweis: Der Free-Plan umfasst 400 Credits mit Gamma-Branding. Plus (ab ~8 USD/Monat) hebt das Branding auf und bietet unbegrenzte KI, Pro ergänzt Premium-Modelle, Custom-Branding, Analytics und API-Zugang, Ultra bringt die leistungsstärksten Modelle und Early-Access-Features.

Microsoft Designer

Microsoft Designer ist Microsofts KI-Design-App für Social-Media-Grafiken, Einladungen, Poster, Präsentationen und Bildbearbeitung. Im Hintergrund arbeiten OpenAI-Modelle wie DALL·E 3 und seit Anfang 2026 GPT-Image-1.5 für hochwertige Bildgenerierung und -bearbeitung. Designer läuft als kostenlose App auf Windows, iOS und Android und ist in die Photos-App von Windows sowie die Microsoft-365-Copilot-App integriert. Der Free-Tarif bietet 15 Boosts pro Tag, Copilot Pro hebt das Limit auf 100 Boosts.

Was du mit Microsoft Designer machen kannst: Text-zu-Bild mit DALL·E 3 und GPT-Image-1.5 – Bilder aus einem Textprompt erzeugen; seit Anfang 2026 mit höherer Qualität und besserer Text-Darstellung im Bild. Bild per Prompt weiterbearbeiten – generierte oder hochgeladene Bilder direkt per Sprachbefehl anpassen (Hintergrund tauschen, Farben ändern, Objekte hinzufügen). Restyle Upload – eigene Fotos hochladen und in einem anderen Stil, mit anderer Stimmung oder Szene neu rendern lassen. Vorlagen und Prompt-Templates – vorgefüllte Prompts mit Ideen, Stilen und Beschreibungen, um schnell zu starten. Social-Media-Designs – Posts, Stories, Reels-Cover, Einladungen, Lebensläufe, Poster und Visitenkarten aus fertigen Layouts erzeugen. Typografie und Farben – automatische Layout-Optimierung, Markenschriften, Farbschemata und professionelle Kombinationen. Stock-Integration – Zugriff auf Microsoft-eigene Stock-Bilder und Vorlagen ohne Lizenzgebühren. Integration in Windows Photos – Designer-Funktionen wie KI-Bildbearbeitung direkt aus der Windows-Fotos-App starten. Integration in Microsoft 365 Copilot – Designer-Grafiken direkt aus Copilot-Apps oder aus Word, PowerPoint und der mobilen M365-Copilot-App heraus generieren. Cross-Plattform – kostenlose App für Windows, iOS und Android; Designs synchronisieren sich über das Microsoft-Konto. Hinweis: Die Nutzung ist mit Microsoft-Konto kostenlos (15 Boosts/Tag). Copilot Pro erweitert das tägliche Kontingent auf 100 Boosts und bringt zusätzlich Vorrang bei neuen Modellen und Features.

Bilder, Video

18 Tools verfügbar

18

Adobe FireFly

Adobe Firefly ist Adobes Familie generativer KI-Modelle und gleichzeitig die zentrale Oberfläche für Bild-, Video- und Audio-Generierung im Creative-Cloud-Ökosystem. Seit April 2026 ergänzt der Firefly AI Assistant als Creative Agent eine konversationelle Oberfläche, die komplexe Workflows über Photoshop, Premiere, Lightroom, Express und Illustrator hinweg orchestriert. Firefly verwendet eigene, lizenzkonform trainierte Modelle und integriert über 30 Drittanbieter-Modelle (u. a. Kling 3.0 und Kling 3.0 Omni). Zielgruppe sind Designer, Content-Profis und Video-Editoren; Adobe-Konto erforderlich.

Was du mit Adobe Firefly machen kannst: Text-zu-Bild – Motive aus Prompts erzeugen; dank lizenzkonformer Trainingsdaten eignen sich die Ergebnisse für kommerzielle Verwendung. Text-Effekte – Worte mit individuellem Stil, Material und Textur versehen. Generative Füllung und Expand – in Photoshop Inhalte ergänzen, Hintergründe erweitern oder Objekte nahtlos einsetzen. Firefly AI Assistant (April 2026) – Creative Agent, der per Dialog mehrstufige Aufgaben in Firefly, Photoshop, Premiere, Lightroom, Express und Illustrator plant und ausführt; zeigt seine Zwischenschritte transparent an. Creative Skills – vorgefertigte Mini-Workflows (z. B. Portrait-Retusche mit festen Presets oder Multi-Channel-Social-Content) sowie die Möglichkeit, eigene Skills zu bauen. Precision Flow – viele Bildvarianten aus einem Prompt erzeugen und per Slider durchsuchen. AI Markup – mit Pinsel oder Rechteck direkt im Bild markieren, wo Bearbeitungen stattfinden sollen. Firefly Video Editor – Clips generieren und bearbeiten, mit Enhance Speech für Dialogbereinigung, Audio-Verbesserungen und erweiterten Farbkontrollen. Drittanbieter-Videomodelle – Kling 3.0 und Kling 3.0 Omni sowie insgesamt über 30 Videomodelle neben den hauseigenen Firefly-Modellen. Firefly Board – kollaborative Moodboards für Teams, um Ideen, Referenzen und Prompts gemeinsam zu entwickeln. Kommerzielle Nutzbarkeit – Adobes Firefly-Modelle sind für die Verwendung in kommerziellen Projekten freigegeben; erzeugte Inhalte enthalten Content Credentials zur Transparenz. Integration in Creative Cloud – Firefly ist über eigene Web-Oberfläche nutzbar und zusätzlich in Photoshop, Illustrator, Premiere, Lightroom und Express eingebettet. Hinweis: Firefly-Nutzung erfordert ein Adobe-Konto. Kostenlose Credits pro Monat sind enthalten; Creative-Cloud- oder Firefly-Abos schalten höhere Kontingente, Premium-Modelle und professionelle Features frei.

DeeVid.ai

Bild- und Videoerstellung. Kostenlose Nutzung möglich. Auch Google Banana Pro Bilder

Hauptfunktionen von DeeVid.ai Text-zu-Video → Aus einem einfachen Textprompt wird ein vollständiges Video generiert, das die Inhalte visuell darstellt. Bild-zu-Video → Statische Bilder können animiert und mit Effekten versehen werden, sodass daraus kurze Videoclips entstehen. Video-zu-Video → Bereits vorhandene Videos lassen sich in neue Stile umwandeln, mit Effekten versehen oder in andere Genres transformieren. Vorlagen & Effekte → Bietet eine Vielzahl an kreativen Templates (z. B. festliche Grüße, Animationen, KI-generierte Szenen) sowie Spezialeffekte wie „Ghibli-Stil“ oder „Haunted House“. Schnelle Generierung → Videos werden in etwa einer Minute erstellt – deutlich schneller als klassische Videobearbeitung. Hohe Qualität → Die KI sorgt für flüssige Animationen, saubere Übergänge und konsistente Ergebnisse. Einfache Bedienung → Auch ohne Erfahrung im Videoschnitt können Nutzer professionelle Ergebnisse erzielen. Datenschutz & Sicherheit → Inhalte werden lokal verarbeitet, es gibt Schutzmechanismen gegen unangemessene oder schädliche Inhalte. Kommerzielle Nutzung möglich → Die generierten Videos dürfen auch für Werbung, Social Media oder andere kommerzielle Zwecke eingesetzt werden (unter Beachtung der Nutzungsbedingungen).

Filmora

ist eine benutzerfreundliche, aber zugleich leistungsstarke Videobearbeitungssoftware, die sowohl Einsteiger als auch Profis anspricht. Sie ermöglicht es, Videos kreativ zu gestalten, zu schneiden, mit Effekten zu versehen und für verschiedene Plattformen zu optimieren. Besonders hervorzuheben ist die Integration von KI-gestützten Tools, die Bearbeitungsschritte automatisieren und die Qualität verbessern. Ziel ist es, Videoproduktion zugänglich, effizient und professionell zu machen – ohne steile Lernkurve.

Funktionsübersicht mit Erklärungen KI-gestützte Bearbeitung Automatisiert Aufgaben wie Objekterkennung, Hintergrundtrennung oder Schärfeoptimierung. So lassen sich Szenen schneller und präziser verbessern. Zeichenstift-Werkzeug Mit diesem Tool können Bewegungspfade gezeichnet und Übergänge fließend gestaltet werden. Ideal für präzise Animationen und dynamische Szenen. Animierte Diagramme Zahlen und Daten werden in anschauliche, bewegte Grafiken verwandelt. Perfekt für Präsentationen oder Marketingvideos. Dynamische Untertitel Untertitel lassen sich individuell anpassen und mit KI optimieren. Sie passen sich dem Stil des Videos an und sorgen für klare Kommunikation. Dual-Timeline-Schnitt Zwei Zeitleisten ermöglichen paralleles Arbeiten: Quell- und Sequenzvorschau nebeneinander für maximale Kontrolle beim Schneiden. Ankerpunkte und Keyframes Bewegungen und Effekte können präzise gesteuert werden. So entsteht professionelle Dynamik und Ausdruckskraft in jeder Szene. Unterprojekte importieren Mehrere Projekte lassen sich kombinieren, Farben mit KI anpassen und harmonisch zusammenführen – ideal für komplexe Produktionen. Kreative Ressourcen Zugriff auf Millionen lizenzfreier Medien, Vorlagen, Effekte, Musik und Sticker. Damit können Videos schnell und kreativ erweitert werden. Magische KI-Funktionen Video-Prompts, DIY-Spezialeffekte und intelligente Automatisierungen erleichtern die Umsetzung kreativer Ideen. Plattformübergreifende Nutzung Filmora funktioniert auf Desktop, Mobile und weiteren Plattformen, sodass Projekte flexibel bearbeitet werden können. Community & Inspiration Austausch mit Millionen von Creators weltweit, inklusive Tutorials, Vorlagen und Experten-Tipps.

Freepik.AI

Text zu Bild, Text zu Video, Alle Möglichkeiten der Bildbearbeitung

Generiert Bilder oder Videos aus Text oder Bildvorlagen. Verschiedene eingebundene Bild- und Videogeneratoren, z.B. FLUX. Image upscale, background remove, explore und viele weitere Möglichkeiten. Kostenlos und eingeschränkt. AB 5 Euro/Monat kostenpflichtiger Plan.

Grok 4.1

? Zusammenfassung Grok.com ist eine Plattform, die verschiedene KI-gestützte Funktionen bereitstellt. Sie kombiniert Chat- und Sprachmodi mit kreativen Werkzeugen wie Bildgenerierung und DeepSearch. Nutzer können damit sowohl Informationen abrufen als auch eigene Inhalte erstellen. Zusätzlich bietet Grok aktuelle Nachrichten, Projektverwaltung und erweiterte Funktionen, die durch ein Upgrade auf „SuperGrok“ für 30 Dollar/Monat freigeschaltet werden können

Leistungen von grok.com Chat-Funktion Interaktive Unterhaltung mit einem KI-gestützten Chat, der Fragen beantwortet und Informationen bereitstellt. Sprachmodus Möglichkeit, mit der KI über Sprache zu interagieren, anstatt nur über Texteingabe. Imagine / Create Image Generierung von Bildern auf Basis von Text-Eingaben, ähnlich wie bei Text-to-Image-Modellen. DeepSearch Erweiterte Suchfunktion, die tiefere und präzisere Ergebnisse liefert als eine Standard-Suche. Projekte Verwaltung und Organisation von Projekten innerhalb der Plattform. Video Zugriff auf visuelle Inhalte oder KI-gestützte Video-Demonstrationen. Aktuelle Nachrichten Bereitstellung von News und relevanten Informationen direkt über die Plattform. Stimme Sprachbasierte Ausgabe oder Steuerung, vermutlich für Text-to-Speech oder interaktive Sprachdialoge. Upgrade auf SuperGrok Freischaltung erweiterter Funktionen und Premium-Features durch ein Upgrade auf Super Grok für 30 Dollar/Monat oder Super Grok Heavy für 300 Dollar/Monat

Higgsfield

Ein KI-gestütztes Inpainting-Tool, das Produkte auf Knopfdruck per Texteingabe pixelgenau in Fotos integriert

MOTION CONTROLS Eyes In Turning Metal + Melting Building Explosion Face Punch Turning Metal Turning Metal + Eyes In Set on Fire Bullet Time Head Explosion Disintegration Action Run Action Run + Set on Fire Agent Reveal Angel Wings Arc Left Bloom Mouth Buckle Up Building Explosion + Disintegration Car Chasing Car Chasing + Building Explosion Car Explosion Car Grip Crane Down Crane Over The Head Crane Over The Head + Crash Zoom In Crane Up Crash Zoom In Crash Zoom In + Face Punch Crash Zoom In + Tentacles Crash Zoom Out Datamosh Dirty Lens Dolly In Dolly Left Dolly Out Dolly Right Dolly Zoom In Dolly Zoom Out Double Dolly Dutch Angle Fisheye Floating Fish Flood Floral Eyes Flying Flying + Set on Fire Focus Change FPV Drone Garden Bloom General Glam Glowshift Handheld Head Tracking Hyperlapse Incline Invisible Jelly Drift Jib Down Jib Up Kiss Lazy Susan Lazy Susan + Super Dolly Out Lens Crack Lens Flare Levitation Levitation + Invisible Low Shutter Medusa Gorgona Morphskin Mouth In Push To Glass Rap Flex Robo Arm Skin Surge Snorricam Snorricam + Low Shutter Soul Jump Static Super Dolly In Super Dolly Out Tentacles Thunder God Thunder God + Levitation Thunder God + Turning Metal Thunder God + Wind to Face Tilt Down Tilt up Timelapse Human Timelapse Landscape Whip Pan Wiggle Wind to Face YoYo Zoom 360 Orbit Zoom In Zoom Out 3D Rotation Arc Right Melting Catch the pulse

Kaiber.AI

Kaiber.ai ist eine Plattform zur KI-gestützten Videogenerierung, die kreative Prozesse automatisiert und visuelle Inhalte aus Textbeschreibungen, Bildern oder Musik erstellt. Sie richtet sich an Künstler, Content Creator, Entwickler und Marken, die schnell hochwertige Videos produzieren möchten. Kostenlose Nutzung mit Anmeldung möglich.

Detaillierte Beschreibung der Funktionen 1. Text-to-Video Du gibst eine Beschreibung ein wie „Ein kleiner Mann verlässt eine Plastikverpackung“. Kaiber interpretiert den Prompt und generiert ein kurzes Video mit animierten Szenen. Ideal für kreative Ideen, Storyboards oder visuelle Experimente. 2. Bild-zu-Video Lade ein Bild hoch (z. B. ein Charakterdesign oder eine Landschaft). Die KI erzeugt eine Bewegung oder Transformation basierend auf dem Bildinhalt. Nützlich für Künstler, die ihre Werke animieren möchten. 3. Musikvisualisierung Du kannst ein Musikstück hochladen. Kaiber erstellt ein Video, das visuell auf die Musik abgestimmt ist – z. B. rhythmische Bewegungen, Farbwechsel oder abstrakte Formen. Besonders beliebt bei Musikern und DJs für YouTube oder Spotify Canvas. 4. Storytelling & Kurzfilme Kombiniere mehrere Szenen zu einer kohärenten Geschichte. Nutze die „Canvas“-Funktion, um Szenen zu planen, zu bearbeiten und zu verbinden. Perfekt für Kurzfilme, Trailer oder experimentelle Erzählformate. 5. Social Media Content Erstelle auffällige, kurze Clips mit hohem Wiedererkennungswert. Die Plattform bietet verschiedene Seitenverhältnisse (z. B. 9:16 für TikTok). Du kannst die Länge, Stil und Intensität der Animationen anpassen. 6. Branding & Marketing Entwickle visuelle Assets, die deine Marke repräsentieren. Nutze Kaiber für Produktvisualisierungen, Logoanimationen oder Kampagnenvideos. Besonders hilfreich für Startups und Agenturen mit begrenzten Ressourcen.

Kling.ai

Kling AI ist eine Next‑Gen Plattform für KI‑Video‑ und KI‑Bildgenerierung. Sie kombiniert mehrere spezialisierte Tools, mit denen du: Bilder generieren Videos generieren Videos mit nativem Audio erzeugen Avatare erstellen Bilder/Videos erweitern oder bearbeiten Professionelle Modi und Video‑Extensions nutzen Assets und Vorlagen durchsuchen Community‑Ergebnisse („Recreate“) verwenden Die Plattform richtet sich klar an Content Creator, die hochwertige Medien automatisiert erstellen wollen.

? 1. Image Generation Erzeugt hochwertige KI‑Bilder aus Text oder Referenzen. Ideal für Artworks, Produktbilder, Konzepte, Social Media. ? 2. Video Generation Generiert komplette Videos aus Text oder Bildern. Unterstützt dynamische Szenen, Kamerafahrten und Animationen. ? 3. Native Audio Erstellt Videos inklusive automatisch generiertem Ton. Die KI synchronisiert Bild und Audio für realistischere Ergebnisse. ?‍? 4. Avatar 2.0 Erzeugt KI‑Avatare, die sprechen, sich bewegen oder in Szenen agieren. Für Tutorials, Präsentationen, Social‑Media‑Content. ? 5. Kling Lab Experimentelle Features und neue Modelle, bevor sie offiziell erscheinen. Für Early Adopters und Power‑User. ?️ 6. Assets & Vorlagen Große Sammlung an Beispielprojekten, Stilen, Szenen und Community‑Ergebnissen. Du kannst jedes Projekt mit „Recreate“ neu generieren. ?️ 7. All Tools – erweiterte Funktionen Beinhaltet zusätzliche Werkzeuge wie: Video‑Extension Professioneller Modus Multi‑Element‑Generierung Motion Control Start‑/End‑Frame‑Tools (je nach Modell und Tarif) ? 8. Professional Mode Erweiterte Einstellungen für Creator, z. B.: höhere Auflösung längere Videos präzisere Kontrolle über Stil und Bewegung ? 9. Credits & Pläne Abos ab 6,99 $ mit Credits und Testphase für Pro‑Features. Ermöglicht skalierbare Nutzung für Hobby bis Profi.

Midjourney Discord Server

Midjourney (Discord) – KI-basierte Bildgenerierung über Discord

Midjourney erzeugt fotorealistische oder künstlerische Bilder durch beschreibende Texte. Über den Discord-Server können Nutzer Befehle eingeben und erhalten in kurzer Zeit hochqualitative Ergebnisse. (https://discord.com/login)

OpusClip Pro

OpusClip von Opus.pro ist ein KI-gestütztes Videobearbeitungstool, das lange Videos automatisch in kurze, virale Clips verwandelt. Es erkennt die besten Momente, fügt Untertitel hinzu, passt das Format für verschiedene Plattformen an und automatisiert den gesamten Workflow – ideal für Content Creator, Unternehmen und Teams, die ihre Reichweite mit Kurzvideos steigern möchten

Funktionsübersicht mit Beschreibungen AI Clipping Schneidet lange Videos automatisch in kurze Clips und wählt die Highlights aus, die am ehesten viral gehen. AI Captioning Fügt automatisch präzise Untertitel hinzu (über 97 % Genauigkeit), die frei bearbeitet werden können. AI Reframe (ReframeAnything) Passt Videos automatisch an verschiedene Formate (9:16, 16:9, 1:1) an und hält bewegte Objekte durch KI-Tracking im Fokus. AI B-Roll Ergänzt Clips mit passenden Zwischenschnitten, um die Aufmerksamkeit zu erhöhen und die Watchtime zu verlängern. AI Audio Enhance Verbessert die Tonqualität, entfernt Störgeräusche und optimiert Sprache für klare Verständlichkeit. AI Voice-over Generiert realistische Sprachaufnahmen, die mit dem Video synchronisiert werden können. ClipAnything-Modell Ein universelles KI-Modell, das jedes Genre (Podcasts, Vlogs, Gaming, Sport, Interviews, Erklärvideos) versteht und daraus Clips erstellt. Workflow Automation Automatisiert den gesamten Prozess von der Clip-Erstellung bis zur Veröffentlichung auf Social-Media-Plattformen. Brand Templates Einheitliche Vorlagen mit Logo, Farben, Schriftarten, Intro/Outro – für konsistente Markenkommunikation. Team Workspace Gemeinsame Arbeitsumgebung für Teams, um Projekte zu verwalten und Inhalte kollaborativ zu erstellen. Workflow Integration (API) Integration in CMS oder andere Tools, um Videoproduktion direkt in bestehende Systeme einzubinden. Multi-Language Support Unterstützt über 20 Sprachen, darunter Deutsch, Englisch, Spanisch, Französisch, Portugiesisch, Italienisch und viele weitere. Growth-Oriented Editing KI-gestützte Analyse von Trends und Plattformdaten, um Clips so zu gestalten, dass sie maximale Reichweite erzielen.

Pika Labs

Pika.art ist eine KI-gestützte Plattform zur Videogenerierung und Bildbearbeitung, die sich besonders für kreative Projekte, visuelle Storytelling und Content-Produktion eignet. Sie erlaubt es dir, aus Texten, Bildern oder bestehenden Videos neue visuelle Inhalte zu erzeugen – mit einem Fokus auf Realismus, Stilvielfalt und Bearbeitbarkeit.

Detaillierte Beschreibung der Funktionen 1. Text-to-Video Du gibst eine Szene als Text ein, z. B. „Ein Verkehrsunfall an einer deutschen Kreuzung“. Pika erzeugt ein kurzes Video mit realistischer Darstellung, Lichtstimmung und Perspektive. Ideal für Storyboards, Kurzfilme oder visuelle Prototypen. 2. Bild-zu-Video Lade ein Bild hoch (z. B. eine Polizeibeamtin auf der Straße). Die KI animiert das Bild, z. B. durch Kamerabewegung, Mimik oder Umgebungseffekte. Nützlich für Künstler, die ihre Werke zum Leben erwecken möchten. 3. Video-Modifikation Du kannst bestehende Videos hochladen und verändern – z. B. durch neue Objekte, Perspektiven oder Stilwechsel. Besonders hilfreich für die Nachbearbeitung oder kreative Variationen. 4. Regionale Bearbeitung Mit „Modify region“ kannst du gezielt einzelne Bildbereiche verändern. Beispiel: Nur die Uniform einer Person wird angepasst, während der Rest des Bildes gleich bleibt. 5. Stil- und Effektanpassung Pika bietet kreative Werkzeuge wie: Pikaffects: Visuelle Effekte (z. B. dramatische Beleuchtung, Farbfilter) Pikaswaps: Objekt- oder Charakteraustausch Pikatwists: Unerwartete Variationen oder Stilbrüche 6. Szenenplanung & Storytelling Mit „Pikaframes“ und „Pikascenes“ kannst du mehrere Szenen zu einer Geschichte verbinden. Du planst Übergänge, Kamerawinkel und Erzählstruktur direkt in der Plattform.

Pikadditions

Video-zu-Video-Feature

Pikadditions ermöglicht es, Motive nahtlos in bestehende Videoaufnahmen zu integrieren. Dadurch können kreative Änderungen oder Ergänzungen ohne sichtbare Übergänge vorgenommen werden.

Pixcap

Pixcap – 3D-Design und KI-gestützte Bild-/Videoerstellung

Pixcap kombiniert eine umfangreiche Bibliothek aus 3D-Elementen mit KI-Funktionen, um ansprechende Bilder und kurze Videos zu generieren. Nutzer können tausende 3D-Objekte in Designs einfügen und die KI für Variationen einsetzen. (https://pixcap.com/)

Playphrase.me Sprach-KI

PlayPhrase.me auf KI-TechLab ist ein unterhaltsames KI-Tool, das es ermöglicht, Videoclips aus Film und Fernsehen zu finden, die einen bestimmten Satz enthalten. Es funktioniert wie eine Suchmaschine für Zitate in audiovisuellen Medien und richtet sich vor allem an Kreative, Content-Ersteller und Meme-Fans.

Anwendung Beschreibung Audio-Sampling für Musik Nutze Filmsätze als kreative Samples für Musikproduktionen oder Sounddesign. YouTube-Videos & B-Rolls Finde passende Clips für deine Videos, z. B. als visuelle Ergänzung oder humorvolle Einleitung. Memes & Social Media Content Erstelle virale Inhalte, indem du bekannte Zitate mit aktuellen Trends kombinierst. Zitatsuche für Präsentationen oder Blogs Verwende prägnante Filmzitate zur Illustration von Aussagen oder zur Auflockerung. Sprachtraining & Ausspracheübungen Höre dir native Sprecher in realen Kontexten an – hilfreich für Sprachlernende. Zusatzinfo: Die Nutzung ist kostenlos und erfordert keine Anmeldung. Du gibst einfach einen Satz ein – z. B. „I’ll be back“ – und erhältst sofort passende Clips aus bekannten Filmen oder Serien.

Runway Gen-4

RunwayML ist eine leistungsstarke Plattform für KI-gestützte Kreativarbeit, die sich auf Video-, Bild- und Audioverarbeitung spezialisiert. Sie richtet sich an Kreative, Entwickler, Filmemacher und Content-Produzenten, die mit Hilfe von generativer KI Inhalte schneller und innovativer erstellen möchten.

Detaillierte Beschreibung der Funktionen 1. Text-to-Video (Gen-2) Du gibst eine Szene als Text ein, z. B. „Ein futuristischer Roboter läuft durch eine verlassene Stadt“. Runway generiert daraus ein kurzes Video mit realistischer Bewegung, Licht und Textur. Ideal für Storyboards, Filmideen oder visuelle Prototypen. 2. Bild-zu-Video Lade ein Bild hoch (z. B. ein Charakterdesign oder eine Landschaft). Die KI animiert das Bild, z. B. durch Kamerafahrten, Bewegungen oder Transformationen. Perfekt für Künstler, die statische Werke zum Leben erwecken möchten. 3. KI-gestütztes Video-Editing Tools wie Green Screen, Inpainting oder Motion Brush ermöglichen: Entfernen oder Ersetzen von Hintergründen ohne Greenscreen Selektives Bearbeiten einzelner Bildbereiche im Video Hinzufügen von Bewegung zu statischen Objekten Besonders hilfreich für Postproduktion, VFX oder Social-Media-Clips. 4. Bildgenerierung & Bearbeitung Erzeuge Bilder aus Text (ähnlich wie DALL·E oder Midjourney). Nutze Tools wie Erase & Replace, um gezielt Bildbereiche zu verändern. Kombiniere mit Stilvorgaben für konsistente visuelle Ästhetik. 5. Audio-Tools Transkribiere automatisch gesprochene Inhalte aus Videos. Erkenne und isoliere bestimmte Geräusche oder Stimmen. Nutze KI zur Generierung von Soundeffekten oder Musikuntermalung. 6. Workflows & Automatisierung Erstelle eigene Pipelines, z. B.: Text → Bild → Video → Schnitt → Export Integriere Runway in bestehende Tools via API oder Webhooks. Besonders nützlich für Teams mit wiederkehrenden Produktionsaufgaben.

Segment Anything Meta

Segment Anything Model – Metas KI-Modell zur Objekterkennung in Bildern und Videos

Das Segment Anything Model (SAM) identifiziert automatisch Objekte in Bildern und verfolgt sie über alle Frames eines Videos. Dies ermöglicht eine präzise Segmentierung für Videobearbeitung, Mixed Reality und andere Anwendungen. (https://segment-anything.com/)

Vimmerse

Vimmerse – KI-gestützte Erstellung von 3D-Videos aus Produktfotos

Vimmerse erstellt aus einfachen Produktfotos eindrucksvolle 3D-Videos. Unternehmen können ihre Produkte damit realistischer präsentieren und Kunden ein interaktives Kauferlebnis bieten. (https://www.vimmerse.net/)

Yapper

Yapper ist ein KI-gestütztes Content-Creation-Tool, das speziell dafür entwickelt wurde, virale Videos und Bilder schnell und einfach zu erstellen. Es kombiniert leistungsstarke Text‑zu‑Video-, Bild‑zu‑Video- und Deepfake-Modelle mit einem benutzerfreundlichen Interface. Ziel ist es, Content Creators, Marketer und Solopreneure in die Lage zu versetzen, hochperformante Inhalte ohne komplexe Videobearbeitung zu produzieren.

⚙️ Funktionsübersicht Text-to-Video: Wandelt Texteingaben direkt in kurze Videos um – ideal für Social Media Clips, Produktvorstellungen oder Storytelling. Image-to-Video: Nutzt vorhandene Bilder als Grundlage und animiert sie zu Videos. Praktisch für Produktbilder oder Kampagnenvisuals. Prompt Assistant: Unterstützt bei der Erstellung passender Prompts, die direkt in Videos oder Bilder umgesetzt werden können. Viral Format Reproduction: Analysiert bestehende TikTok-, Instagram- oder YouTube-Shorts-Links und erstellt daraus automatisch ein reproduzierbares Format, um Trends nachzubauen. Deepfake-Generierung: Erstellt realistische, lip-synchrone Deepfake-Videos aus eigenen Dateien oder YouTube-Links. Stimmen können geklont und synchronisiert werden. Avatar-Generierung: Erzeugt KI-Avatare aus Bildern oder Videos, die für Kampagnen oder Präsentationen genutzt werden können. Audio-Integration: Fügt automatisch passende Tonspuren hinzu oder synchronisiert Stimmen mit Videos. Bildgenerierung: Erstellt KI-Bilder über verschiedene Modelle, die für Kampagnen oder kreative Projekte angepasst werden können. Upscaling & Post-Processing: Verbessert die Qualität von Videos und Bildern durch Nachbearbeitung, z. B. Schärfen oder Audiooptimierung. Kommerzielle Nutzungslizenz: Alle erstellten Inhalte können rechtssicher für Marketing und Werbung eingesetzt werden. Credits-System: Je nach Lizenzpaket stehen monatlich unterschiedliche Mengen an Credits zur Verfügung, die für Video- und Bildgenerierungen genutzt werden.

Bilder, Video, Automatisierung

1 Tool verfügbar

1

Vidu AI

Vidu AI – KI-Tool zur Konvertierung von Text und Bildern in hochwertige Videos

Vidu AI erzeugt aus Texten und Bildern automatisch Videos, die sich für Marketing, Social Media oder Content-Erstellung eignen. Die KI übernimmt dabei Übergänge, Animationen und Soundauswahl. (https://www.vidu.studio/)

Character

2 Tools verfügbar

2

Carisma

Charisma AI – KI-Plattform für interaktive Geschichten mit virtuellen Charakteren

Charisma AI ermöglicht das Erstellen interaktiver Geschichten mit lebensechten Charakteren, die Emotionen, Erinnerungen und eine eigene Stimme besitzen. Anwendbar in Spielen, virtueller Realität, Bildung oder Film, bietet die Plattform Echtzeitanalysen und dynamisches Storytelling. (https://charisma.ai/)

Human Generator

Human Generator – KI-basierte Generierung hyperrealistischer Personen

Human Generator erstellt in Echtzeit Ganzkörperbilder von Menschen. Nutzer können Aussehen, Pose, Kleidung und Hintergrund individuell anpassen, um realistische Charaktere für Spiele, Werbung oder Prototyping zu erzeugen. (https://generated.photos/human-generator/)

Character, ChatBot

1 Tool verfügbar

1

Character.AI

Character.AI – KI-gestützte Charaktererstellung und Interaktion

Character.AI ermöglicht das Erstellen und Interagieren mit virtuellen Persönlichkeiten, seien es fiktive Figuren oder bekannte Prominente. Nutzer können individuelle Charaktere definieren und in Echtzeit Gespräche mit ihnen führen. Durch fortschrittliche KI-Modelle entstehen realistische Dialoge, die für Unterhaltung, kreatives Schreiben oder Studienzwecke genutzt werden können. (https://beta.character.ai/)

Character, Sprache

1 Tool verfügbar

1

PlayHt2.0

PlayHT 2.0 – KI-gestützte Avatar- und Sprachgenerierung

PlayHT 2.0 ermöglicht das Klonen und Erstellen realistischer Stimmen anhand kurzer Sprachproben. Darüber hinaus können Nutzer Avatare erstellen, die in Videos oder Präsentationen eingebunden werden. (https://play.ht/conversational/)

Character, Video, Text zu Sprache

2 Tools verfügbar

2

Cartesia.ai

Cartesia Sonic-3 ist eine hochmoderne Echtzeit-Text-to-Speech-Plattform, die natürliche, emotionale und blitzschnelle Sprachsynthese bietet. Sie ermöglicht KI-Stimmen, die lachen, Gefühle ausdrücken und in über 40 Sprachen sprechen – ideal für den Einsatz in Voice Agents, Kundenservice, Gesundheitswesen und mehr.

– Emotionale Sprachsynthese Lachen, Überraschung, Freude, Traurigkeit – Sonic‑3 erzeugt realistische Emotionen in der Stimme. Ideal für Konversationsagenten, die menschlich und empathisch wirken sollen. – Konsistente Geschwindigkeit & Lautstärke (neu) Verbesserte Stabilität bei Sprechtempo und Lautstärke – ohne Verlust an Ausdruckskraft. Sorgt für gleichmäßige, professionelle Audioqualität in allen Szenarien. – Verbesserte IPA‑Aussprache (neu) Optimierte Unterstützung für benutzerdefinierte IPA‑Transkriptionen. Markennamen, Fachbegriffe und schwierige Wörter klingen zuverlässig korrekt. – Mehrsprachigkeit & Lokalisierung Unterstützt über 40 Sprachen, darunter 9 indische Sprachen wie Hindi. Native Stimmen sorgen für authentische Kommunikation weltweit. – Verbesserte Hindi‑Prosodie (neu) Natürlichere Betonung, flüssigere Intonation und bessere Pausenverarbeitung. Ideal für hochwertige Hindi‑Sprachagenten. – Echtzeit‑Reaktion Ultra‑niedrige Latenz (<100 ms) für flüssige, natürliche Gespräche. Reaktionsgeschwindigkeit unterhalb der menschlichen Wahrnehmungsschwelle („Blink of an eye“). – Kontextverständnis & Intelligenz Korrekte Verarbeitung von Abkürzungen und Initialismen (z. B. „NASA“ vs. „NSA“). Passt sich dem Gesprächsverlauf an und liefert kontextgerechte Antworten. – Voice Cloning Instant Cloning: Individuelle Stimmen in nur 10 Sekunden. Pro Voice Cloning: Feinabgestimmte, professionelle Klone für Unternehmen. – Erweiterte Stimmenbibliothek & Featured Voices (neu) Über 30 kuratierte Premium‑Stimmen, laufend erweitert. Einfaches Testen mit eigenen Skripten oder Live‑Agenten‑Anrufen. Beispiele: Cathy, Henry. – Ein‑Klick‑Feedback (neu) Direktes Feedback im TTS‑Playground mit vollständigem Kontext. Hilft, die Sprachqualität schneller zu verbessern. – Entwicklerfreundlich & skalierbar API & SDKs für einfache Integration. Playground zum Testen im Browser. Enterprise‑ready: SOC 2, HIPAA, PCI‑konform. – Branchenlösungen Healthcare, Customer Service, Sales, Recruiting, Gaming u. v. m. Personalisierte Stimmen für jede Rolle – vom Sidekick bis zum Experten. – Performance & Zuverlässigkeit Weltweit führende Latenz (P50 bis P99). Hohe Verfügbarkeit und Skalierbarkeit für globale Anwendungen. – Neues Versionierungsschema (ab 18.12.2025) sonic‑3‑latest: Frühzugang zu neuesten Modellen, ideal für Tests & Feedback. sonic‑3 & sonic‑3‑YYYY‑MM‑DD: Stabile, produktionsreife Checkpoints. Änderungen wandern innerhalb von 2–4 Wochen in stabile Snapshots.

D-ID

D-ID.com ist eine führende Plattform für die Erstellung von KI-generierten Videos und digitalen Avataren, die sich besonders für Unternehmen, Entwickler und Content-Creator eignet. Sie verwandelt einfache Texte, Bilder oder Audiodateien in lebendige, sprechende Videos – mit fotorealistischen Avataren, automatischer Übersetzung und API-Zugriff für individuelle Anwendungen.

Einzelne Anwendungsmöglichkeiten: Visual AI Agents Erstelle digitale Gesprächspartner, die dein Unternehmen repräsentieren – inklusive Stimme, Aussehen und Wissen über deine Produkte. Video Studio Verwandle Fotos oder Videos in sprechende Avatare mit realistischer Mimik und Lippenbewegung. Video Translate Übersetze Videos automatisch in über 30 Sprachen – inklusive Lippen-Synchronisation und Untertitel. Video Campaigns Nutze personalisierte Videos für E-Mail-Marketing, Kundenbindung oder interne Kommunikation. API-Zugriff Integriere D-ID-Funktionen direkt in deine App oder Plattform – z. B. für Echtzeit-Streaming oder automatisierte Videoerstellung. PowerPoint & Canva Integration Erstelle KI-Videos direkt in bekannten Tools wie PowerPoint, Google Slides oder Canva. Voice Cloning & Audio Upload Nutze eigene Stimmen oder importiere Audio, um Avatare individuell sprechen zu lassen. Team Collaboration & Enterprise-Support Für größere Organisationen: Zusammenarbeit im Team, professionelle Übersetzungsdienste und höchste Sicherheitsstandards. Natural User Interface (NUI) Entwickle intuitive, gesichtsbasierte Interfaces – z. B. für KI-gestützte Beratung oder interaktive Lernplattformen.

ChatBot

31 Tools verfügbar

31

AgentGPT

AgentGPT – KI-gestütztes Agentensystem

AgentGPT ermöglicht das Konfigurieren und Ausführen autonomer KI-Agenten im Browser. Der Agent erstellt eigenständig Aufgaben, führt sie aus und bewertet die Ergebnisse, um ein zuvor definiertes Ziel zu erreichen. (https://agentgpt.reworkd.ai/de)

Bart

Bard – Googles KI-Chatbot

Bard ist ein ChatBot von Google, der auf großen Sprachmodellen basiert und aktuelle Informationen einbinden kann. Er liefert Quellenangaben, interpretiert Bilder und ermöglicht tiefergehende Dialoge zu beliebigen Themen. (https://bard.google.com/)

Briefy

Briefy – KI-basierte Zusammenfassung von Texten, Audios und Videos

Briefy fasst mit einem Klick umfangreiche Inhalte wie Blogartikel, Audios oder Videos strukturiert zusammen. Die KI erkennt die Kernaussagen und erstellt eine kompakte Übersicht für schnelles Verständnis. (https://briefy.ai/)

Chatbot Arena LMArena.ai

LMArena bietet eine interaktive Umgebung, in der du Fragen an mehrere KI-Modelle gleichzeitig stellen kannst. Die Antworten werden nebeneinander angezeigt, sodass du sie direkt vergleichen und bewerten kannst. Dein Feedback fließt in eine öffentliche Rangliste ein, die zeigt, welche Modelle bei echten Nutzern am besten abschneiden. Auch Bilderstellung möglich. Auch mit nano banana pro

Einzelne Funktionen und Anwendungsmöglichkeiten Funktion Beschreibung Multimodell-Vergleich Stelle eine Frage und erhalte Antworten von verschiedenen LLMs wie GPT-4, Claude, Gemini, Mistral etc. Öffentliches Ranking Modelle werden basierend auf Nutzerbewertungen in einer Rangliste geführt – du kannst mitentscheiden. Feedback geben Bewerte jede Antwort direkt (z. B. hilfreich, ungenau, kreativ), um die Plattform zu verbessern. Antwortverlauf & Transparenz Du kannst vergangene Antworten einsehen und nachvollziehen, wie sich Modelle bei verschiedenen Fragen schlagen. Hinweis zur Datennutzung Eingaben und persönliche Informationen können öffentlich geteilt und an KI-Anbieter weitergegeben werden – daher keine sensiblen Daten eingeben

ChatGPT

12.07.2026: OpenAI baut ChatGPT aktuell von einem klassischen Chatbot zu einer vollständigen Arbeitsumgebung um . Diese strategische Neuausrichtung umfasst eine neue Modellgeneration, einen eigenständigen Arbeitsagenten, eine neue All-in-One-App und einen stark verbesserten Sprachmodus . Die neuen Modelle: Die GPT-5.6 Familie Die Intelligenz des neuen Systems liefert die Modellgeneration GPT-5.6, welche in drei Leistungsstufen (Namen) unterteilt ist : Soul: Das leistungsstärkste Modell für besonders komplexe Aufgaben wie Programmierung, tiefgehende Forschung und Sicherheitsanalysen . Terra: Ein starker Kompromiss aus Leistung und Kosten, der qualitativ etwa auf oder über dem Niveau von GPT-5.5 liegt . Dieses Modell steht in bestimmten Bereichen auch Free- und Go-Nutzern zur Verfügung . Luna: Die schnellste und günstigste Variante für Aufgaben, bei denen Geschwindigkeit und die Verarbeitung großer Datenmengen im Vordergrund stehen . Zusätzlich führt OpenAI zwei neue Betriebsmodi ein, um die Leistung bei anspruchsvollen Aufgaben zu steigern: Max: Gibt der KI deutlich mehr Zeit zum Nachdenken ("Reasoning"), um bessere Antworten zu generieren . Ultra: In diesem Modus arbeiten standardmäßig vier KI-Agenten parallel an einer Aufgabe und führen ihre Ergebnisse am Ende zusammen . Dies verbraucht zwar mehr Rechenleistung, liefert aber bei komplexen Problemen in kürzerer Zeit bessere Resultate und ist primär für Pro-Nutzer gedacht

Die wichtigsten Änderungen und neuen Werkzeuge 1. ChatGPT Work (Der Arbeitsagent) Während ein klassischer Chat Fragen beantwortet, soll der neue Agent "Work" aus einem vorgegebenen Ziel ein fertiges Ergebnis erstellen – wie etwa eine Präsentation, eine strukturierte Tabelle, einen Bericht oder sogar eine kleine interaktive Website . Der Agent kann größere Aufgaben in Einzelschritte zerlegen und über mehrere Stunden hinweg daran arbeiten . Über Plugins kann er Informationen aus Diensten wie Slack, Google Drive, Teams oder E-Mails zusammentragen . In der Desktop-App verfügt er über "Computeruse": Mit Erlaubnis des Nutzers kann die KI lokale Dateien und Programme bedienen, also selbstständig klicken und tippen . 2. Die neue All-in-One Desktop App OpenAI bietet nicht länger für jede Aufgabe ein eigenes Werkzeug an, sondern vereint diese in einer zentralen Anwendung für Mac und Windows . Die ehemals eigenständige Programmier-App "Codex" geht in dieser neuen Software auf . Die App unterteilt sich in drei Bereiche : Chat: Für schnelle Fragen und normale Konversationen . Work: Für die Büroarbeit, längere Aufgaben und fertige Ergebnisse . Codex: Der spezialisierte Bereich für Softwareentwicklung, der nun unter anderem Pull-Request-Reviews direkt in der Seitenleiste erlaubt . 3. GPT Live (Der neue Sprachmodus) Der Sprachmodus erhält mit "GPT Live One" (und "One Mini" im kostenlosen Tarif) ein massives Upgrade durch die "Full Duplex"-Technologie . Das Modell kann nun gleichzeitig zuhören und sprechen . Es verarbeitet das Gespräch kontinuierlich, wodurch es den Nutzer bei kurzen Denkpausen nicht mehr ungewollt unterbricht und sich umgekehrt jederzeit vom Nutzer unterbrechen lässt . Diese Arbeitsweise ermöglicht extrem flüssige Unterhaltungen und sogar Simultanübersetzungen ohne Wartezeiten . Um Ressourcen zu schonen, übernimmt GPT Live nur das natürliche Sprechen. Benötigt eine Frage eine Websuche oder komplexe Denkarbeit, wird diese im Hintergrund an ein stärkeres Modell (wie GPT-5.5 oder 5.6) delegiert, welches das Ergebnis dann wieder an den Sprachmodus zurückgibt

ChatGPT Playground

ChatGPT Playground – Entwicklerumgebung für ChatGPT-APIs und Prompt-Tests

Der ChatGPT Playground erlaubt das Experimentieren mit verschiedenen Prompt-Einstellungen und KI-Modellen. Entwickler können hier ChatGPT-APIs ansprechen, Scripting testen und die Antworten evaluieren. (https://platform.openai.com/playground)

Chatplayground.ai

ChatPlayground – Plattform mit Zugriff auf 10 führende Chatbots

ChatPlayground integriert verschiedene Chatbots wie Claude3, GPT-4 oder MistralAI auf einer Oberfläche. Nutzer können die Ausgaben vergleichen und Zusatzfunktionen wie Dateiuploads oder Prompt-Verwaltung nutzen. (https://www.chatplayground.ai/)

Copyingai

CopyingAI – KI-basierte Content-Generierung aus Video und PDF

CopyingAI kann aus YouTube-Videos oder PDF-Dateien in wenigen Klicks Blog-Artikel oder andere Textformen generieren. Eine Chat-Funktion erlaubt es, sich direkt mit dem Inhalt auseinanderzusetzen und gezielt Fragen zu stellen. (https://copyingai.com/)

DayZero

DayZero – KI-basierter Chatbot für Aktionspläne

DayZero verwandelt Ideen innerhalb von 6 Minuten in einen auf Umsetzbarkeit fokussierten Aktionsplan. Nutzer geben ihre Vorstellungen ein, und die KI strukturiert diese in konkrete Schritte, um Ziele effizient zu erreichen. (https://beta.dayzero.ai/)

DeepSeek

DeepSeek – Reasoning-Chatbot mit starken logischen und mathematischen Fähigkeiten

DeepSeek zerlegt Aufgaben in Einzelschritte und bildet Gedankenketten, wodurch es besonders in Mathematik und Physik glänzt. Die KI artikuliert ihre Argumentation vor der finalen Antwort und bietet eine transparente Lösungsfindung. (https://chat.deepseek.com/)

Gemini Deep Research

Liefert dir tiefgreifende Recherchen mit detaillierten Ergebnissen

Tiefgehende Recherche in Internetquellen mit ausführlicher Darstellung der Vorgehensweise. Gemini 2.5 Flash-Lite Ein Einführung von 2,5 Flash-Lite, unser neues kosteneffizientes Argumentationsmodell, optimiert für Aufgaben mit niedriger Latenz. Erstellen Sie schnellere und leistungsstärkere Agentenanwendungen mit nativen Unterstützung für Tools wie die Grounding mit Google -Suche, URL -Kontext und Codeausführung. Gemini 2.5 Flash Durch das Ausgleich von Geschwindigkeit und Leistung ausbalancieren, übernimmt dieses Arbeitspferdmodell multimodale, codierte und langkontextbezogene Aufgaben im Maßstab. Um die Planung zu vereinfachen und die Kosteneffizienz von 2,5 Flash-Lite widerzuspiegeln, aktualisieren wir 2,5-Flash-Preise auf 0,30 USD / 1-Mio.-Eingangs-Token und 2,50 USD / 1-Mio.-Ausgabe-Token, wobei die Denk- und Nicht-Denken-Preis-Differenz entfernt werden. Das 2,5-Flash-Vorschau 04-17-Modell wird nach dem 15. Juli 2025 nicht mehr unterstützt. Sie können zum allgemein verfügbaren Modell übergehen oder als Option niedrigerer Kosten in die 2,5-Flash-Lite-Vorschau wechseln. G emini 2.5 Pro Unser intelligentestes Modell ist jetzt produktionsbereit und erstreckt sich über die Bestenlisten LMARena und Webdev Arena und erhält noch höhere Noten für Aider Polyglot, GPQA und HLE als die vorherige Version. Wir haben auch denkenden Budgets hinzugefügt, um mehr Kontrolle darüber zu erhalten, wie viel die Modellgründe.

Google Bard

Google Bard – KI-gestützter Chatbot von Google

Google Bard ist eine KI-Anwendung, die Konversationen in natürlicher Sprache führt, Bilder interpretiert und kontextbezogene Antworten liefert. Als Teil von Google Labs wird Bard kontinuierlich verbessert und kann für Recherchen, Ideenfindungen und vieles mehr eingesetzt werden. (https://bard.google.com/)

Google Gemini in Chrome Adresszeile

Google Gemini – Chatbot-Integration in der Chrome-Adresszeile

Nutzer können in der Chrome-Adressleiste „@“ eingeben und „Mit Gemini chatten“ auswählen, um direkt KI-gestützte Antworten zu erhalten. Das System basiert auf Googles neuester Gemini-Technologie. (https://gemini.google.com/app/e6a9f452d8e26065)

HAWKI

Zugriff auf mehrere Sprachmodelle wie ChatGPT, LLaMA, Mistral und Qwen KI-gestützte Textgenerierung für akademische, kreative oder technische Zwecke Vergleich von Modellen zur Analyse von Stärken und Schwächen Dokumenten-Upload zur Verarbeitung und Analyse eigener Inhalte Nutzung ausschließlich für Hochschulangehörige mit KI-Campus-Account

Detaillierte Beschreibung der Funktionen 1. Mehrmodell-Zugriff Nutzer können zwischen verschiedenen LLMs wählen: ChatGPT (OpenAI) LLaMA (Meta) Mistral Qwen Dies ermöglicht einen direkten Vergleich der Antwortqualität, Stilistik und Fähigkeiten. 2. Textgenerierung Eingabe von Prompts zu beliebigen Themen (z. B. KI, Ethik, Technik, Bildung) Die Modelle generieren daraufhin Texte, Erklärungen, Zusammenfassungen oder kreative Inhalte. Ideal für Studierende, Lehrende und Forschende zur Ideenfindung oder Texterstellung. 3. Dokumenten-Upload Nutzer können eigene Dateien hochladen (z. B. PDFs, Texte). Die KI kann Inhalte analysieren, zusammenfassen oder Fragen dazu beantworten. Besonders hilfreich für Literaturauswertung, Prüfungsvorbereitung oder Projektarbeit. 4. Modellvergleich Durch parallele Nutzung mehrerer Modelle lassen sich Unterschiede in: Argumentationsstruktur Sprachstil Faktengenauigkeit Kreativität analysieren. Dies fördert ein tieferes Verständnis für die Funktionsweise von LLMs. 5. Zugangsbeschränkung Die Plattform ist ausschließlich für Hochschulangehörige zugänglich. Anmeldung erfolgt über einen KI-Campus-Account. Dies gewährleistet einen geschützten Raum für akademische Nutzung.

Humata.AI

Humata.AI – KI-gestützter Chatbot für PDF-Dokumente

Humata.AI fungiert als „GPT für Dateien“. Nutzer können PDFs hochladen und gezielt Fragen zum Inhalt stellen. Die KI analysiert den Text und liefert sofort verständliche Antworten. Ideal für schnelle Durchsicht von Dokumenten und Wissensmanagement. (https://app.humata.ai/login)

Ionos

Der KI-Assistent von IONOS, der oft auch als Chatbot-Funktion oder KI-Copilot vermarktet wird, ist ein vielseitiges Werkzeug, das Unternehmen dabei unterstützt, ihre Online-Präsenz zu optimieren und die Effizienz ihrer digitalen Prozesse zu steigern. **IONOS Kunde sein:** Die KI-Services sind in der Regel an bestehende IONOS Produkte und Dienstleistungen gekoppelt. Man muss also Kunde bei IONOS sein und ein entsprechendes Paket gebucht haben.

IONOS GPT basiert auf dem IONOS AI Model Hub , der das Llama-Modell bereitstellt. • Text-Assistent: Klare, kreative und professionelle Inhalte für jeden Einsatzzweck. • Bild-Assistent: Einfache Generierung und Bearbeitung von professionellen Bildern, die sich sehen lassen können. • Code-Assistent: Alles rund um Programmierung und Automatisierung aus einer Hand. • Wissens-Assistent: Präzise Antworten, verlässlich recherchiert und verständlich erklärt für solide Business-Entscheidungen. Direkt starten: IONOS GPT braucht keine Einarbeitung, sondern ermöglicht die Interaktion mit der KI völlig intuitiv im Chat-Modus

Mistral

Mistral.ai ist eine leistungsstarke Plattform für generative KI, die sich auf offene, konfigurierbare Large Language Models (LLMs) spezialisiert hat. Sie richtet sich an Unternehmen, Entwickler und Organisationen, die KI-Lösungen selbst hosten, anpassen und sicher einsetzen möchten – sei es in der Cloud, lokal oder am Edge.

Einzelne Möglichkeiten im Überblick: Enterprise Agents Erstelle KI-Agenten, die Aufgaben automatisiert ausführen, sich anpassen und mit deinen Apps und Datenquellen interagieren. AI-powered Search Integriere intelligente Suchfunktionen, die deine unternehmensspezifischen Daten durchforsten und präzise Antworten liefern. Deep Research Nutze KI für umfassende Recherchen und Zusammenfassungen aus komplexen Quellen – ideal für Analyse, Strategie und Wissensmanagement. Coding & Analysis Erhalte Unterstützung beim Programmieren in über 80 Sprachen – inklusive Code-Vervollständigung, Optimierung und Debugging. File Processing Verarbeite beliebige Dateien mit KI-gestützter OCR und Vision-Modellen – z. B. zur Texterkennung, Strukturierung oder Analyse. Builder APIs Entwickle eigene KI-Anwendungen mit Mistrals APIs – von einfachen Bots bis zu komplexen Agentensystemen. Bespoke AI Deployments Trainiere und deploye maßgeschneiderte Modelle mit deinen Daten – inklusive Fine-Tuning, Distillation und Integration in bestehende Systeme. Privacy-first Infrastructure Nutze Mistral lokal, in der Cloud oder am Edge – mit voller Kontrolle über deine Daten und Sicherheitsrichtlinien.

Mixtral

Mixtral – Kostenfreier Chatbot ähnlich ChatGPT

Mixtral bietet einen GPT-ähnlichen Chat ohne Registrierungszwang. Nutzer können beliebige Fragen stellen und kontextbezogene Antworten erhalten, ohne ein Konto anlegen zu müssen. (https://mixtral.replicate.dev/)

Momento

Momento AI – KI-basierte Erstellung eines persönlichen Chatbot-Klons

Momento AI ermöglicht das Erstellen eines eigenen KI-Klons, der rund um die Uhr echte Gespräche führen kann. Kreative und Content Creator nutzen dieses Tool, um „Creator Burnout“ zu reduzieren, indem der Klon Fragen beantwortet und interagiert. (https://www.momentoai.com/)

Nichess

Nichess – KI-Chatbot mit 1-Klick-Blogpost und Artikelerstellung

Nichess ermöglicht das Generieren von Blogartikeln, Social-Media-Posts oder Produktbeschreibungen in nur einem Klick. Eine Browsererweiterung unterstützt zudem die Integration in externe Tools wie ahrefs oder SEMrush. (https://nichesss.com/)

Olilo

Olilo.ai – KI-Portal zum Vergleich verschiedener Chatbots

Olilo.ai bindet ChatGPT, Bard, Claude und Jurassic auf einer Plattform ein, sodass man die Antworten verschiedener KI-Systeme direkt nebeneinander vergleichen kann. Dies erleichtert es, das beste Modell für den eigenen Use Case zu finden. (https://olilo.ai/llms)

Pi.Ai

Pi.AI – Persönlicher KI-Chatassistent für vielseitige Anwendungsfälle

Pi.AI fungiert als persönlicher Begleiter, der aktuelle Ereignisse kommentiert, Restaurantempfehlungen gibt, beim Lernen hilft oder Programmierfragen beantwortet. Ein Allround-Chatbot für den Alltag. (https://pi.ai/)

POE

Poe – Chat-Plattform zur Einbindung verschiedener KI-Modelle

Poe bietet eine Oberfläche, um mehrere KI-Sprachmodelle (z.B. Claude2, ChatGPT, Google-PaLM, Llama-2) zu testen und zu vergleichen. So können Nutzer verschiedene Modelle ausprobieren und ihre Stärken gezielt einsetzen. (https://poe.com/)

Proactor

Ein kontextbewusster KI-Teampartner, der Aufgaben eigenständig erkennt und vorantreibt.

Lösungen für jedes Team und jeden Einzelnen Arbeit & Meetings Proactor bietet Live-Analysen und proaktive Ratschläge während Besprechungen und Gesprächen. Hilft Ihnen, konzentriert zu bleiben und bessere Ergebnisse zu erzielen. Vertriebsteams Proactor schlägt während der Anrufe wirkungsvolle Fragen und persönliche Tipps vor. Es findet Anzeichen dafür, dass Kunden bereit sind, zu kaufen, und bearbeitet Follow-up-E-Mails für Sie. Rekrutierungsteams Proactor hört sich die Vorträge der Kandidaten live an. Es schlägt gute Fragen vor, die als nächstes gestellt werden sollen, und vergleicht die Antworten mit den Stellenanforderungen, alles in Echtzeit. Geschäftsteams Proactor gibt live Strategieideen und Aktionspunkte. Es stellt sicher, dass sich alle mit klaren Zusammenfassungen einig sind, und trägt dazu bei, dass Projekte reibungslos voranschreiten. Medien Proactor generiert Live-Ideen für die Recherche und prüft Fakten in Interviews. Es schlägt Story-Blickwinkel vor und erstellt leicht interessante Inhalte. Bildung Proactor erstellt nicht nur Vorlesungsnotizen, sondern findet relevante Ressourcen in Echtzeit und erklärt schwierige Ideen sofort.

Quivr

Quivr – Cloudbasierter Chatbot für unstrukturierte Informationen

Quivr ist ein „zweites Gehirn in der Cloud“: Nutzer können verschiedenste Dateiformate speichern und anschließend per Chat darauf zugreifen. Das System extrahiert wichtige Inhalte und ermöglicht schnelles, kontextbezogenes Fragen. (https://www.quivr.app/)

Qwen

Qwen Chat ist mehr als nur ein KI-Chatbot – es ist ein multimodales Assistenzsystem, das Texte versteht, Bilder analysiert, Webseiten durchsucht, Dokumente verarbeitet und dir beim Programmieren hilft. Du kannst direkt im Browser mit Qwen interagieren, Fragen stellen, Inhalte generieren oder komplexe Aufgaben lösen lassen. Die Plattform eignet sich für Entwickler, Kreative, Analysten und alle, die KI produktiv einsetzen möchten.

Einzelne Anwendungsmöglichkeiten: Chatbot-Funktion Stelle Fragen, führe Gespräche oder lasse dir Inhalte generieren – von Texten über Zusammenfassungen bis zu kreativen Ideen. Bildverarbeitung & Bildverständnis Lade Bilder hoch und erhalte Beschreibungen, Analysen oder visuelle Interpretationen – z. B. für UI-Feedback oder OCR. Bildgenerierung Erzeuge Bilder aus Textbeschreibungen mit KI – ideal für kreative Projekte, Illustrationen oder visuelle Prototypen. Videoverständnis (in Entwicklung) Analysiere Videoinhalte, extrahiere Szenen oder erhalte Zusammenfassungen – besonders spannend für Medienanalyse. Dokumentenverarbeitung Lade PDFs, Word-Dateien oder andere Dokumente hoch und lasse Inhalte extrahieren, zusammenfassen oder interpretieren. Websuche-Integration Kombiniere KI mit Live-Webdaten – z. B. für aktuelle Informationen, Quellenrecherche oder Faktenprüfung. Tool-Nutzung & Agentenfunktionen Qwen kann externe Tools nutzen, z. B. für Berechnungen, Code-Ausführung oder Datenanalyse – ähnlich wie ein KI-Agent. Softwareentwicklung & Codehilfe Schreibe, analysiere oder optimiere Code in verschiedenen Sprachen – inklusive Debugging und API-Integration. Deep Research & Wissensanalyse Führe komplexe Recherchen durch, vergleiche Quellen oder strukturiere große Informationsmengen. Reiseplanung & Organisation Nutze Qwen als Planungsassistent für Reisen, Events oder Projekte – inklusive Routen, Empfehlungen und Zeitplanung.

Rationale

Rationale – KI-Tool für Entscheidungsfindung mit Pro- und Kontra-Analyse

Rationale listet Vor- und Nachteile zu einer anstehenden Entscheidung auf, erstellt SWOT-Analysen und führt Multikriterien- oder Kausalanalysen durch. Damit hilft das Tool, komplexe Optionen abzuwägen und rationale Entscheidungen zu treffen. (https://rationale.jina.ai/)

ROMO AI

ROMO AI – All-in-One-KI für Text-, Bild-, Code- und Audiogenerierung

ROMO AI vereint verschiedene KI-Funktionen unter einer Oberfläche: Nutzer können Texte verfassen, Bilder erstellen, Code generieren oder Audiodateien analysieren. Auch SEO-Artikel und Dateiuploads werden unterstützt. (https://www.romoai.com/)

Summit

Summit – KI-basierter Life-Coach-Chatbot

Summit unterstützt Nutzer dabei, persönliche Ziele zu definieren und zu erreichen. Durch KI-gestützte Gesprächsführung werden praktische Tipps, Motivationshilfen und individuell zugeschnittene Handlungspläne bereitgestellt. (https://www.summit.im/)

Undetectable.AI

Undetectable.AI – KI-Tool zur Umwandlung von ChatGPT-Text in menschliche Texte

Undetectable.AI transformiert KI-generierte Antworten so, dass sie von gängigen AI-Detection-Tools nicht mehr als KI-Text erkennbar sind. Dies ist besonders nützlich, um natürlich wirkende Texte zu veröffentlichen. (https://undetectable.ai/)

YouLeran

YouLearn – KI-gestützter Chat-Tutor für Video- und Textinhalte

YouLearn dient als personalisierter Tutor, der hochgeladene YouTube-Clips, Google Docs, PDFs oder Präsentationen analysiert. Die KI gibt strukturierte Zusammenfassungen, erfasst Kernaussagen und beantwortet Fragen zum Lernmaterial. (https://www.youlearn.ai/)

Chatbot Builder

1 Tool verfügbar

1

Hubspot

Mit intelligenter Automatisierung und Personalisierung optimiert HubSpot Ihre Prozesse und steigert die Effizienz Ihres Unternehmens.

Was ist HubSpot? HubSpot ist eine Plattform, die Software, Integrationen und Ressourcen bereitstellt, um Marketing-, Vertriebs- und Kundenservice-Teams nahtlos miteinander zu vernetzen. Jedes einzelne Produkt für sich ist leistungsstark – aber gemeinsam sind sie unschlagbar.

ChatBot lokal

4 Tools verfügbar

4

AI Dana

Webbasiert: Die Anwendung AI Dana: Web LLM ermöglicht es, große Sprachmodelle direkt im Browser auszuführen – vollständig lokal, ohne dass Daten das eigene Gerät verlassen. Damit bietet sie eine sichere, datenschutzfreundliche Möglichkeit, KI-gestützte Textverarbeitung und Interaktion zu nutzen

Möglichkeiten der Anwendung Browserbasierte Ausführung von LLMs Modelle laufen direkt im Browser, ohne externe Server. Das bedeutet: keine Datenübertragung, volle Kontrolle über die eigene Privatsphäre. Modellverwaltung (Manage Models) Nutzer können verschiedene Sprachmodelle herunterladen, laden und verwalten. So lässt sich flexibel zwischen unterschiedlichen Modellgrößen und -fähigkeiten wechseln. Neue Chats starten Es können beliebig viele neue Chat-Sitzungen begonnen werden. Jede Sitzung ist unabhängig und kann für unterschiedliche Themen genutzt werden. Projektverwaltung (Projects) Neben Chats lassen sich Projekte anlegen, die eine strukturierte Arbeit mit KI ermöglichen – etwa für längere Texte, Dokumentationen oder wiederkehrende Aufgaben. Einstellungen (Settings) Anpassung der Anwendung an die eigenen Bedürfnisse, z. B. Auswahl des Standardmodells, Interface-Optionen oder Speicherverwaltung. Offline-Nutzung Da die Modelle lokal geladen werden, funktioniert die Anwendung auch ohne Internetverbindung, sobald ein Modell heruntergeladen ist. Datenschutzfreundliche Architektur Keine Daten verlassen das Gerät. Dies ist besonders relevant für sensible Inhalte oder vertrauliche Dokumente.

GPT4all

GPT4All – Lokale Ausführung von großen Sprachmodellen auf Desktop-Rechnern

GPT4All ermöglicht das Ausführen von LLMs wie GPT-J oder LLaMA direkt auf dem eigenen Laptop oder PC, ohne Cloud-Anbindung. Nutzer können offline Fragen stellen, Texte generieren oder Dokumente analysieren. (https://www.nomic.ai/gpt4all)

Msty

Msty – Lokale Chatbot-App ohne Docker und Terminal

Msty erlaubt das Betreiben eines KI-Chatbots komplett offline und ohne komplexe Installation. Mit nur einem Klick können Nutzer den Chat starten, Daten lokal speichern und ihre Privatsphäre wahren. (https://msty.app/)

Ollama

Ollama – Lokaler KI-Assistent mit Unterstützung für mehrere Modelle

Ollama erlaubt das lokale Ausführen großer Sprachmodelle unter macOS, Linux oder Windows (Vorschau). Mit einer integrierten Bibliothek an Modellen wie Llama 3.1 oder Mistral lassen sich Chat- und Codieraufgaben offline erledigen. (https://ollama.com/)

ChatBot lokal webbasiert

1 Tool verfügbar

1

Web LLM

Die Anwendung WebLLM ist eine leistungsstarke In-Browser-Engine für Sprachmodelle. Sie ermöglicht es, große KI-Modelle direkt im Webbrowser auszuführen – ohne Serveranbindung – und nutzt moderne Hardwarebeschleunigung (WebGPU). Dadurch bietet WebLLM Vorteile wie Datenschutz, Kostenreduktion und Personalisierung, da die Berechnungen lokal im Browser stattfinden

Möglichkeiten der Anwendung In-Browser Inference Sprachmodelle laufen direkt im Browser, beschleunigt durch WebGPU. Keine externe Serververarbeitung nötig – ideal für Datenschutz und Unabhängigkeit. Volle OpenAI-API-Kompatibilität WebLLM kann wie die OpenAI-API genutzt werden, inklusive Funktionen wie JSON-Mode, Function Calling und Streaming. Damit lassen sich bestehende Anwendungen leicht anpassen. Umfangreiche Modellunterstützung Unterstützt viele bekannte Modelle wie Llama, Phi, Gemma, RedPajama, Mistral, Qwen und weitere. So ist die Plattform vielseitig für unterschiedliche KI-Aufgaben einsetzbar. Integration eigener Modelle (Custom Models) Eigene Modelle im MLC-Format können eingebunden werden. Dies erlaubt maßgeschneiderte Lösungen für spezifische Szenarien. Plug-and-Play Integration Einfache Einbindung in Projekte über NPM, Yarn oder CDN. Dank modularer Architektur lässt sich WebLLM schnell mit UI-Komponenten verbinden. Streaming & Echtzeit-Interaktionen Unterstützt Streaming-Ausgaben für Chatbots oder Assistenten, wodurch Antworten in Echtzeit generiert und angezeigt werden. Web Worker & Service Worker Support Berechnungen können in separate Threads ausgelagert werden. Das verbessert die Performance und sorgt für flüssige Benutzeroberflächen. Chrome Extension Support WebLLM kann in Browser-Erweiterungen integriert werden. Beispiele zeigen, wie einfache oder komplexe Extensions erstellt werden können.

ChatBot, Assistant

1 Tool verfügbar

1

Jasper

Jasper – KI-gestützter Chat- und Content-Assistent

Jasper unterstützt die Erstellung von Inhalten für Blogs, Social Media, Websites und mehr. Mit über 50 generativen Funktionen, Unterstützung in mehr als 25 Sprachen und integrierten Tools wie Pronomen- und Verberkennung hilft Jasper, Texte gezielt zu optimieren und vielseitig einzusetzen. (https://www.jasper.ai/free-trial)

ChatBot, Assistant, Bilder

2 Tools verfügbar

2

Neuroflash

KI-Textgenerator: Erstellung von Blogartikeln, Social Media Posts, E-Mails und mehr. ChatFlash: KI-gestützter Chat für Content-Ideen und schnelle Antworten. Bildgenerator: KI-Bilder passend zu Texten oder Kampagnen erstellen. Brand Voice: Einheitliche Markenstimme für alle Inhalte sichern. SEO-Tools: Optimierung von Texten für bessere Sichtbarkeit. Plagiats-Check: Inhalte auf Einzigartigkeit prüfen. PerformanceFlash: Content-Wirkung vorhersagen und optimieren. ResearchFlash: KI-gestützte Recherche und Datenaufbereitung. Teamfunktionen: Kollaboration, Rollen- und Rechteverwaltung. Integrationen: Anbindung an Tools wie Unsplash, LanguageTool, Seobility.

KI-Textgenerator Erstellt automatisch hochwertige Texte für verschiedene Formate: Blogartikel, Newsletter, Social Media Posts, Produktbeschreibungen und mehr. ChatFlash Ein interaktiver KI-Chat, der Fragen beantwortet, Content-Ideen liefert und beim Schreiben unterstützt – ähnlich wie ein persönlicher Assistent. Bildgenerator Generiert KI-Bilder basierend auf Text-Prompts. Ideal für Kampagnenvisuals, Social Media oder Präsentationen. Brand Voice Generator Analysiert die gewünschte Markenstimme und sorgt dafür, dass alle Inhalte konsistent im Ton und Stil bleiben. SEO-Optimierung Tools zur Analyse und Verbesserung von Texten für Suchmaschinen. Enthält Keyword-Optimierung, Textanalysen und unbegrenzte SEO-Checks (je nach Paket). Plagiats-Checker Prüft Inhalte auf Originalität und stellt sicher, dass Texte frei von Plagiaten sind. PerformanceFlash Prognostiziert die Wirkung von Inhalten auf Zielgruppen und hilft, Texte vor Veröffentlichung zu optimieren. ResearchFlash Unterstützt bei der Recherche von Themen, Zielgruppen und Trends. Spart Zeit bei der Informationsbeschaffung. Workflows & Automatisierung Standard- und erweiterte Workflows für Content-Erstellung, SEO und Teamarbeit. Teamfunktionen Gemeinsames Arbeiten an Projekten mit Rollen- und Zugriffsmanagement, Kollaborationstools und Workspaces. Integrationen Unsplash: Zugriff auf lizenzfreie Bilder. LanguageTool: Rechtschreib- und Grammatikprüfung. Seobility: SEO-Analyse. CopyScape: Plagiatsprüfung. Datensicherheit DSGVO-konforme Verarbeitung, deutsche Server und keine Nutzung der Daten zum Training von KI-Modellen. Support & Training Tutorials, Webinare, Workshops und persönlicher Customer Success Manager (je nach Paket).

Writesonic

Writesonic – KI-gestütztes Text- und Bildgenerierungstool

Writesonic (bzw. ChatSonic) bietet einen Chatbot ähnlich ChatGPT, aber mit Echtzeitdaten, integrierter Bildgenerierung und Sprachsuche. Die Anwendung erstellt Artikel, Produktbeschreibungen und weitere Texte in über 25 Sprachen. Mit einem Abo ab 13 USD/Monat stehen große Wortkontingente (z.B. 100.000 Wörter) zur Verfügung. (https://app.writesonic.com/)

ChatBot, Automatisierung

2 Tools verfügbar

2

Levity

Levity – No-Code KI-Plattform zur Automatisierung von Workflows

Levity erlaubt das Training einer eigenen KI, um wiederkehrende Aufgaben zu automatisieren und die Teamproduktivität zu steigern. Über 5000 Apps lassen sich integrieren, sodass Text extrahiert, klassifiziert oder generiert werden kann. (https://levity.ai/)

Zapier

Zapier – KI-gestützte Automatisierungs- und ChatBot-Plattform

Zapier verbindet verschiedene Apps und Dienste, um automatisierte Workflows zu erstellen. Mit KI-Funktionen lassen sich Daten formatieren, Chatbots konfigurieren und Prozesse effizient gestalten. (https://zapier.com/ai)

ChatBot, Erweiterung

2 Tools verfügbar

2

Customgpt.AI

CustomGPT.AI – KI-Plattform zur Erstellung von ChatGPT-Plugins

CustomGPT.AI ermöglicht das Erstellen eigener ChatGPT-Plugins, um individuelle Datenquellen oder Websites einzubinden. Ohne Coding-Kenntnisse lassen sich Chatbot-Funktionen erweitern und maßgeschneiderte Anwendungsfälle abdecken. (https://customgpt.ai/customgpt-plugins/)

Monica

Monica – KI-gestützte ChatBot-Browsererweiterung

Monica ist eine Browser-Erweiterung, die per Strg+M erreichbar ist. Sie bietet über 80 Vorlagen für Marketing-Texte, kann ausgewählten Text auf Webseiten erklären, übersetzen oder umformulieren und parallel Google-Suchergebnisse einbinden. (https://microsoftedge.microsoft.com/addons/detail/monica-ihr-chatgpt-copi/fhimbbbmdjiifimnepkibjfjbppnjble)

ChatBot, Erweiterung, Assistant

3 Tools verfügbar

3

MaxAi

MaxAi – KI-Erweiterung für Browser mit Zusammenfassungs- und Chatfunktionen

MaxAi integriert sich in Chrome oder Edge und erlaubt das Zusammenfassen von Texten, Übersetzen oder Chatten per KI. Die Basisversion ist kostenpflichtig; ein Abonnement ist für die Nutzung erforderlich. (https://app.maxai.me/my-plan)

Screen Lens/ google lens

Screen Lens – Browser-Erweiterung zur Bildsuche mit Google Lens

Screen Lens überträgt die Funktionalität von Google Lens auf den Desktop. Mit einem Klick kann der angezeigte Bildschirminhalt durchsucht werden, ohne Dateien hochladen zu müssen. (https://chromewebstore.google.com/detail/screen-lens-search-screen/iplfibchfgfkoakangdejiogheoheaip)

Voila

Voila – Browser-Erweiterung für KI-Funktionen wie Zusammenfassungen und Chat

Voila ermöglicht KI-gestützte Zusammenfassungen, Übersetzungen und Chatfunktionen direkt im Browser. Ab 0 Euro verfügbar, mit höherpreisigen Tarifen für zusätzliche Features. Lässt sich mit ChatGPT-Abo verbinden. (https://chat.openai.com/chat?model=gpt-4)

ChatBot, Erweiterung, Assistant, Programmieren, Mindmap

4 Tools verfügbar

4

Jambot

Figma.com ist eine cloudbasierte Design- und Kollaborationsplattform, die es Teams ermöglicht, gemeinsam Benutzeroberflächen (UI), Prototypen, Websites und Apps zu entwerfen – alles in Echtzeit und direkt im Browser. Sie richtet sich an Designer, Entwickler, Produktmanager und Kreativteams, die effizient und visuell zusammenarbeiten wollen.

Einzelne Möglichkeiten im Überblick: UI/UX Design Erstelle pixelgenaue Benutzeroberflächen für Web, Mobile und Desktop – mit flexiblen Layouts und responsivem Verhalten. Prototyping Baue interaktive Prototypen mit Klickpfaden, Animationen und Übergängen – ideal für Usability-Tests und Präsentationen. Designsysteme & Komponenten Nutze wiederverwendbare Bausteine, Variablen und Bibliotheken, um konsistente Designs über Teams hinweg zu gewährleisten. Dev Mode Übergib Designs direkt an Entwickler mit Spezifikationen, CSS-Snippets und Assets – ohne zusätzliche Tools. FigJam (Whiteboard) Brainstorme, plane und visualisiere Ideen kollaborativ – z. B. mit Mindmaps, Post-its oder Flowcharts. Teamkollaboration in Echtzeit Mehrere Personen können gleichzeitig am gleichen Projekt arbeiten – inklusive Kommentarfunktion und Versionsverlauf. AI-gestützte Funktionen Nutze KI, um Inhalte zu generieren, Code vorzuschlagen oder Layouts automatisch zu optimieren (z. B. mit „Prompt to Code“). Templates & Vorlagen Starte mit fertigen Layouts für Websites, Apps, Präsentationen, Social-Media-Posts und mehr. Plugins & Integrationen Erweiterbare Plattform mit Hunderten von Plugins – z. B. für Barrierefreiheit, Übersetzungen, Icons, Animationen oder Datenvisualisierung. Figma Sites & Figma Make (Beta) Erstelle komplette Websites direkt in Figma – mit oder ohne Code, inklusive Hosting und Veröffentlichung.

Merlin

Merlin kombiniert die Stärken von GPT-4, Claude, Gemini, Mistral und weiteren Modellen in einer einzigen Oberfläche. Du kannst Inhalte analysieren, schreiben, übersetzen, zusammenfassen und sogar mit Dateien oder Webseiten chatten. Die Erweiterung ist besonders für Power-User, Entwickler, Content-Creator und Rechercheprofis geeignet, die KI direkt in ihren Workflow integrieren möchteng

Einzelne Anwendungsmöglichkeiten: Multimodell-Chat Nutze GPT-4, Claude, Gemini u. a. parallel in einem Interface – ideal für Vergleich und tiefere Analysen. Webseiten-Chat Öffne Merlin als Sidebar auf jeder Website und interagiere direkt mit dem Inhalt: Zusammenfassen, Übersetzen, extrahieren. Datei-Chat & Vision-Funktionen Lade PDFs, Bilder oder Dokumente hoch und stelle gezielte Fragen – inklusive OCR und Bildanalyse. Video- und Artikel-Zusammenfassungen Erhalte Highlights aus YouTube-Videos oder Texten – mit bilingualen Untertiteln und kompakten Übersichten. Textgenerierung & Schreibhilfe Verfasse Tweets, Blogposts, E-Mails oder Werbetexte direkt im Browser – inklusive Stil- und Tonanpassung. Übersetzung & Lokalisierung Übersetze Inhalte in über 50 Sprachen, inklusive Bild- und Videoübersetzung mit Untertitel-Synchronisation. Prompt-Verwaltung Speichere und verwalte eigene Prompts für schnellen Zugriff – nutzbar überall online mit „/“-Befehl. AI Playground Teste verschiedene Modelle in einer zentralen Umgebung – ideal für kreative oder technische Experimente. Crafts & Code-Generierung Erstelle Code, Diagramme oder Apps direkt im Chat – mit Live-Vorschau und Exportfunktionen. Projekte & Custom Agents Baue eigene KI-Chatbots auf Basis deiner Daten, Dateien oder Links – inklusive zentraler Verwaltung. Browser-Integration & Shortcuts Starte Merlin mit Ctrl+M/Cmd+M aus jedem Tab – für sofortigen Zugriff auf alle Funktionen.

Napkin AI

Beatoven – KI-gestützte Musikproduktion

Beatoven ist eine KI-gestützte Musikplattform, die es ermöglicht, schnell und einfach individuelle Musikstücke zu komponieren. Nutzer können ein Video oder einen Podcast hochladen, um die passende musikalische Untermalung zu erzeugen, oder direkt mit einem neuen Track starten. Acht verschiedene Musikgenres stehen zur Auswahl, um den Klang optimal an das jeweilige Thema anzupassen. Die Anwendung erleichtert so die professionelle Vertonung von Projekten und passt sich flexibel an verschiedene Formate und Längen an. (https://www.beatoven.ai/)

Mubert

Mubert – KI-basierte Musikgenerierung

Mubert erzeugt individuelle Musikstücke mithilfe fortschrittlicher KI-Algorithmen. Nutzer können in Echtzeit die Länge und das Genre bestimmen, um passgenaue Soundtracks für Videos, Apps oder persönliche Projekte zu erhalten. (https://mubert.com/)

Music FX

Music FX – Googles KI-Tool zur Liedkomposition per Texteingabe

Music FX nutzt KI, um anhand kurzer Texteingaben neue Songs zu generieren. Anwender können Stil, Tempo und Instrumentierung festlegen und die Musik anschließend als MP3 oder WAV herunterladen. (https://aitestkitchen.withgoogle.com/tools/music-fx)

Stable.AI

Stable.AI – KI-gestützte Musikgenerierung per Textprompt

Stable.AI bietet die Möglichkeit, Musik durch Texteingaben zu erstellen. Nutzer können Instrumente, Beats und Stilrichtungen vorgeben. Monatlich stehen 20 Tracks mit jeweils 45 Minuten zur Verfügung. (https://stableaudio.com/)

Suno v3

Suno v3 – KI-basierte Musikgenerierung mit bis zu 2-minütigen Tracks

Suno v3 erstellt aus einem einfachen Prompt Songs von bis zu zwei Minuten Länge. Die KI kombiniert Melodien, Beats und ggf. Gesang, um individuelle Musikstücke für Content Creator oder private Projekte zu liefern. (https://www.suno.ai/)

Suno.Ai

Suno.AI – KI-gestützte Musikkomposition mit Gesang

Suno.AI generiert bis zu 2-minütige Songs, einschließlich Gesangslinien, basierend auf kurzen Texteingaben. Das Tool bietet verschiedene Stile und kann auch als Kollaborationspartner für Musiker dienen. (https://www.suno.ai/)

VoiceSwap

VoiceSwap – KI-Tool zum Ändern von Gesangsstimmen

VoiceSwap ermöglicht es, die eigene Gesangsstimme mit der eines vorgestellten Künstlers auszutauschen. Das KI-System analysiert Stimmlage und Timbre und passt sie an, um ein neues musikalisches Ergebnis zu erzeugen.

Musik, Sprache

1 Tool verfügbar

1

Vocelremover org

VocalRemover.org – KI-Tool zum Trennen von Gesang und Instrumentalspur

VocalRemover.org separiert Stimme und Begleitmusik aus Audiodateien, um z.B. Karaoke-Versionen zu erzeugen oder Instrumentalspuren für Remixe zu verwenden. Die KI erkennt Gesangsspuren präzise und filtert sie heraus. (https://vocalremover.org/)

Podcast

2 Tools verfügbar

2

Adobe Podcast-Enhance Speech

Adobe Podcast Enhance – KI-basierte Audiooptimierung

Adobe Podcast Enhance verbessert Sprachaufnahmen, indem Störgeräusche und Hall automatisch entfernt werden. Das Tool eignet sich für Podcasts, Videovertonungen oder jede andere Art von Audioaufnahmen. (https://podcast.adobe.com/enhance)

Podium

Podium – KI-Assistent für Podcast-Erstellung und -Optimierung

Podium unterstützt Podcaster bei Show Notes, Kapiteln, Transkripten, Highlight-Clips und Social-Media-Beiträgen. Damit sparen Produzierende Zeit und können ihren Content für ein größeres Publikum optimieren. (https://hello.podium.page/)

Präsentation

8 Tools verfügbar

8

Beautiful.AI

Beautiful.AI – KI-gestützte Präsentationserstellung

Beautiful.AI stellt „smarte“ Folienvorlagen zur Verfügung, die sich automatisch anpassen, um ästhetisch ansprechende Präsentationen zu erzeugen. Nutzer sparen Zeit bei Layout, Design und Formatierung, während die KI für ein professionelles Erscheinungsbild sorgt. (https://www.beautiful.ai/)

Butternut

Butternut – KI-basierter Website-Generator

Butternut erzeugt in kurzer Zeit eine funktionsfähige Website. Dank KI-Unterstützung können Inhalte und Layout automatisiert gestaltet werden, ohne dass Programmierkenntnisse erforderlich sind. Ideal für schnelle Webprojekte oder Landingpages. (https://butternut.ai/)

Canva Magic Studio

Canva Magic Studio – KI-Funktionen für Präsentationen, Bilder und Videos

Magic Studio bietet verschiedene KI-basierte Tools wie Magic Switch, Magic Media und Magic Design, um Präsentationen, Bilder oder Videos automatisiert zu erstellen oder zu erweitern. Funktionen wie Magic Expand oder Magic Morph erlauben das Rekonstruieren und Bearbeiten von Bildbereichen. (https://www.canva.com/newsroom/news/magic-studio/)

ChatBA

ChatBA – KI-Tool zur automatischen Präsentationserstellung

ChatBA erstellt aus Textangaben komplette Präsentationen. Dabei lassen sich Layout, Stil und Inhalte flexibel anpassen. Ideal für Nutzer, die schnell und unkompliziert professionelle Folien benötigen. (https://www.chatba.com/)

Makelanding

Makelanding – KI-gestützter Landingpage-Generator

Makelanding erzeugt in wenigen Schritten funktionsfähige Websites als Landingpages. Dank KI-Technologie erfolgt die Anpassung von Layout und Inhalten automatisch, was insbesondere für Marketingkampagnen oder Produktvorstellungen nützlich ist. (https://makelanding.ai/)

Neuraltext

Neuraltext – KI-gestützte Text- und Präsentationserstellung

Neuraltext bietet eine Vielzahl von KI-basierten Funktionen für die Content-Erstellung, darunter Texte, Marketingstrategien und Präsentationen. Über 50 Vorlagen stehen zur Verfügung, außerdem integrierte SEO-Tools zur Suchmaschinenoptimierung. So lassen sich Inhalte schnell und zielgerichtet produzieren. (https://www.neuraltext.com/)

Tome

Tome – KI-gestützte Plattform zur schnellen Präsentationserstellung

Tome kombiniert Geschwindigkeit und Qualität, indem es in wenigen Minuten aus einem Prompt eine ansprechende Präsentation erstellt. Das Tool unterstützt visuelle Effekte, interaktive Elemente und bietet eine intuitive Bearbeitungsoberfläche. (https://tome.app/)

Uizard

Uizard – KI-gestützte Plattform für UI/UX-Prototyping

Uizard erleichtert die Erstellung von Designoberflächen für Websites und Apps. Nutzer können Mockups, Prototypen und Layouts entwerfen, während die KI das Design automatisch optimiert und Screenshots in bearbeitbare Entwürfe umwandelt. (https://uizard.io/)

Programmieren

7 Tools verfügbar

7

10Web

10Web – KI-Website-Builder für schnelle Webseitenerstellung

10Web generiert automatisch Inhalte und Bilder basierend auf ein paar Fragen zum Unternehmen. Dank integriertem Hosting und PageSpeed Booster lassen sich Websites rasch erstellen und optimieren. (https://10web.io/)

Copilot Chat

GitHub Copilot Chat – KI-Assistent für Programmierung mit Chat-Funktion

GitHub Copilot Chat erweitert den beliebten Programmierassistenten GitHub Copilot um eine Chat-Komponente. Das Modell ist speziell auf Entwickler- und Code-Interaktionen abgestimmt und kann in Echtzeit Hilfestellungen, Code-Snippets und Optimierungsvorschläge liefern. (https://docs.github.com/de/copilot/github-copilot-chat/)

Copilot Chat

QR Code AI – KI-gestützter QR-Code-Generator

QR Code AI erstellt individuelle QR-Codes, die an die Markenästhetik angepasst werden können. Neben Website-URLs lassen sich Kontaktdaten, Werbeangebote oder Produktdetails integrieren. Die KI generiert dabei einzigartige Designs, um sich von Standard-QR-Codes abzuheben. (https://qrcode-ai.com/)

Cursor

Cursor – KI-gestützter Code-Editor mit Chatfunktion

Cursor bietet eine Chat-Integration, die den geschriebenen Code analysiert, Fragen beantwortet oder Verbesserungen vorschlägt. Mit leistungsstarker Autovervollständigung und Code-Generierung können Entwickler produktiver arbeiten. (https://www.cursor.com/)

Landingsite.AI

Landingsite.AI – KI-basierter Website-Baukasten für schnelle Online-Präsenz

Landingsite.AI erlaubt das Erstellen einer ansprechenden Website in wenigen Minuten. Eine integrierte KI kann Texte generieren, Bilder vorschlagen und das Layout anpassen. (https://landingsite.ai/)

Langflow

Langflow – Visuelle KI-App-Entwicklung mit Drag-and-Drop-Komponenten

Langflow erleichtert das Zusammenstellen von LLM-basierten Anwendungen durch ein grafisches Interface. Entwickler können Eingabeaufforderungen, Variablen und Komponenten ohne tiefgehende Programmierkenntnisse verbinden. (https://www.langflow.org/)

Replit Agent

Replit Agent – KI-gestütztes Tool zur Softwareentwicklung

Der Replit Agent versteht natürliche Spracheingaben und hilft beim Erstellen neuer Anwendungen. Für Teams konzipiert, macht er Softwareentwicklung für Einsteiger und Profis gleichermaßen zugänglich. (https://docs.replit.com/replitai/agent)

Programmieren, Folien erstellen, Bilder, Tabellenkalkulation, Video, Audio

1 Tool verfügbar

1

Manus.im

Die Seite zeigt im Funktionsmenü folgende Hauptfunktionen: Folien erstellen Website erstellen Apps entwickeln Design Textgenerierung Recherche Teilweise kostenlose Nutzung möglich. Automatisierung Agenten‑Workflows Datenverarbeitung

1. Folien erstellen Automatische Generierung kompletter Präsentationen aus Text oder Stichpunkten Erstellung von Layouts, Folienstrukturen und visuellen Elementen Ideal für Pitch Decks, Schulungen, Workshops oder Dokumentationen 2. Website erstellen Generiert vollständige Websites aus natürlicher Sprache Erstellt HTML/CSS/JS‑Strukturen oder komplette Web‑Layouts Unterstützt schnelle Prototypen, Landingpages oder interne Tools 3. Apps entwickeln Erzeugt mobile oder Web‑Apps aus einfachen Beschreibungen Kann Logik, UI‑Elemente und Abläufe automatisch generieren Eignet sich für MVPs, interne Tools oder schnelle App‑Experimente 4. Design Erstellung visueller Designs wie UI‑Layouts, Grafiken oder Mockups Unterstützt kreative Prozesse wie Branding, Interface‑Ideen oder visuelle Konzepte Kann als Grundlage für Designer oder Entwickler dienen 5. Mehr Platzhalter für zusätzliche Funktionen, die nicht einzeln auf der Startseite genannt werden Typischerweise umfasst dies weitere KI‑gestützte Tools wie: Textgenerierung Recherche Automatisierung Agenten‑Workflows Datenverarbeitung (Die Seite selbst listet diese nicht konkret auf, daher nur allgemeine Interpretation.)

Programmieren, KI-Entwicklung

1 Tool verfügbar

1

Hugging

Hugging Face – Plattform für Machine-Learning-Modelle und KI-Entwicklung

Hugging Face ist eine Community-Plattform, auf der Modelle, Datensätze und Anwendungen rund um Machine Learning erstellt und geteilt werden. Sie bietet Spaces für kollaborative Projekte, Open-Source-Tools und Enterprise-Lösungen zur Beschleunigung von KI-Workflows. (https://huggingface.co/)

Recherche

12 Tools verfügbar

12

Connected Papers

Connected Papers – Visualisierung zusammenhängender Forschungsarbeiten

Connected Papers basiert auf den Daten von Semantic Scholar und zeigt Paper zu ähnlichen Themen in einem interaktiven Graphen. Dadurch lassen sich Forschungsstrukturen intuitiv erkunden. (https://www.connectedpapers.com/)

Consensus

Consensus – KI-Suchmaschine für wissenschaftliche Artikel

Consensus durchsucht über 200 Millionen wissenschaftliche Arbeiten. Ergebnisse werden nach Relevanz und Vertrauenswürdigkeit sortiert, mit klaren Zitaten und Links zu den Originalquellen. (https://consensus.app/)

Double

Double – KI-gestützte Lead-Recherche und Datenanreicherung

Double vereinfacht das Auffinden, Bereinigen und Qualifizieren von Leads, indem es automatisierte Online-Recherchen durchführt. So lassen sich wichtige Informationen schneller extrahieren und in bestehende Workflows integrieren. (https://www.usedouble.com/)

Elicit

Elicit – KI-gestützte Literaturrecherche

Elicit nutzt Sprachmodelle, um den Forschungsprozess zu automatisieren. Das Tool findet relevante wissenschaftliche Artikel, auch ohne perfekte Keyword-Übereinstimmung, fasst Papers spezifisch auf die gestellte Frage zusammen und extrahiert wichtige Informationen. So beschleunigt Elicit den Rechercheaufwand für Studien, Literaturübersichten oder akademische Arbeiten. (https://elicit.org/)

Inciteful

Inciteful – Kostenlose Tools zur Beschleunigung akademischer Recherche

Inciteful bietet verschiedene KI-Funktionen, um sich mit einem neuen Thema vertraut zu machen, passende Literatur zu finden oder Zusammenhänge zwischen Ideen zu erkennen. (https://inciteful.xyz/)

Litmaps

Litmaps – KI-gestützte Plattform zur Visualisierung wissenschaftlicher Arbeiten

Litmaps erstellt „Karten“ zu Forschungsthemen und verknüpft Papers miteinander. Nutzer erkennen so schnell relevante Studien, Cluster und Entwicklungslinien. (https://www.litmaps.com/)

Platoria

Platoria – KI-gestützte Produktbewertungs- und Kaufentscheidungsplattform

Platoria nutzt KI, um Produktbewertungen zu analysieren und zusammenzufassen. So erhalten Nutzer eine schnelle Übersicht über Stärken, Schwächen und Kundenmeinungen und können fundiertere Kaufentscheidungen treffen. (https://www.platoria.com/)

Researchrabbit

ResearchRabbit – Intelligente Literaturrecherche

ResearchRabbit ermöglicht eine neuartige Rechercheerfahrung, indem es zeigt, in welchen wissenschaftlichen Arbeiten bestimmte Publikationen zitiert werden, und thematisch ähnliche Papers identifiziert. So wird das Auffinden relevanter Studien und das Erkunden von Forschungsnetzwerken erheblich vereinfacht. (https://www.researchrabbit.ai/)

Scite

Scite – KI-Assistent für Literaturrecherche und Zitationsanalysen

Scite zeigt neben klassischen Suchergebnissen auch Zitationsanalysen, indem es z.B. die Art und Häufigkeit von Zitationen darstellt. Ein KI-Assistent beantwortet Fragen zu Papers oder Themenbereichen. (https://scite.ai/home)

Semantic Scholar

Semantic Scholar – KI-basierte Literaturrecherche mit generativen Add-ons

Semantic Scholar durchsucht Millionen wissenschaftlicher Publikationen und bietet Referenzen, thematisch verwandte Dokumente sowie ein generatives Add-on namens „Ask this paper“. (https://www.semanticscholar.org/)

Tugan

Tugan – KI-basierte Internetrecherche und Content-Generierung

Tugan ermöglicht das Einfügen von Artikeln oder YouTube-Links, um automatisiert Newsletter, Tweets, Threads oder LinkedIn-Posts zu erstellen. Die KI extrahiert relevante Informationen und generiert aus dem Material zielgruppengerechte Inhalte. (https://www.tugan.ai/)

Typeset.io

Typeset.io – KI-gestützte Literaturauswertung und wissenschaftliche Textgenerierung

Typeset.io findet passende Quellen, liefert Zitate und generiert Textvorschläge für wissenschaftliche Arbeiten. Zusätzlich können Dokumente in verschiedenen Formaten exportiert werden, etwa als PDF oder LaTeX. (https://typeset.io/de)

Recherche, Sprache, Suche

1 Tool verfügbar

1

2Read

2Read – KI-Kindle-Begleiter zur Textanalyse, Zusammenfassung und Sprachunterstützung

2Read extrahiert Texte von Kindle-E-Books, erstellt Zusammenfassungen und hilft beim Wissensaufbau. Das Tool analysiert Inhalte, beantwortet Fragen und bietet Übersetzungen oder Erklärungen. (https://www.2read.app/)

Reisen

2 Tools verfügbar

2

Mindtrip

Mindtrip – KI-gestützter Reiseplaner mit personalisierten Empfehlungen

Mindtrip erstellt basierend auf hochgeladenen Links, Fotos oder PDFs personalisierte Reisepläne. Die KI schlägt Sehenswürdigkeiten, Unterkünfte und Aktivitäten vor, die zum individuellen Reisestil passen. (https://mindtrip.ai/)

Tripnotes

Tripnotes – KI-gestützter Reiseplaner

Tripnotes plant in Sekunden einen individuellen Reiseverlauf. Nutzer geben den gewünschten Ort und ihre Interessen ein, woraufhin die KI passende Empfehlungen für Sehenswürdigkeiten, Restaurants oder Aktivitäten erstellt. (https://tripnotes.ai/app/)

Social Media

4 Tools verfügbar

4

AddCreative

AddCreative – KI-Generator für Werbeanzeigen und Social-Media-Inhalte

AddCreative erstellt in Sekundenschnelle ansprechende Werbemittel und Social-Media-Posts. Nutzer geben kurze Produkt- oder Kampagneninfos ein, und die KI generiert Layouts, Bilder und Texte für verschiedene Plattformen. (https://de.adcreative.ai/)

HeyPat

HeyPat – KI-Interaktion mit ChatGPT über WhatsApp und Telegram

HeyPat ermöglicht die Kommunikation mit ChatGPT direkt aus WhatsApp oder Telegram. So können Nutzer ohne separate App KI-generierte Antworten abrufen und Fragen stellen. (https://www.heypat.ai/)

https://creasquare.io/

Creasquare – KI-gestützte Social-Media-Inhaltserstellung

Creasquare hilft bei der Erstellung von Social-Media-Designs und -Bildern durch Texteingaben. Nutzer können eigene Bilder hochladen und bearbeiten, Hintergründe anpassen und Schriften hinzufügen. (https://creasquare.io/)

Submagic

Submagic – KI-gestützte Untertitel- und Keyword-Generierung für Kurzvideos

Submagic erstellt automatisch Untertitel für TikTok-, Instagram- oder YouTube-Kurzvideos und ergänzt Emojis sowie hervorgehobene Schlüsselwörter. Dadurch werden Kurzclips ansprechender und erreichen mehr Interaktionen. (https://www.submagic.co/)

Sprache

6 Tools verfügbar

6

Audio Pen

AudioPen – KI-Tool zur Umwandlung von Sprachnotizen in lesbaren Text

AudioPen transkribiert Sprachaufnahmen und formatiert sie in leicht lesbare Texte. Perfekt für Meeting-Mitschriften, Notizen oder Blogartikel, die man unterwegs einfach einsprechen möchte. (https://audiopen.ai/)

Eleven Labs

ElevenLabs – KI-gestützte Stimmenerzeugung und -klonung

ElevenLabs bietet fortgeschrittene Text-to-Speech-Funktionen und Voice-Cloning, um Stimmen zu erstellen oder zu duplizieren. Dabei können personalisierte Stimmen in verschiedenen Projekten wie Hörbüchern, Videos oder Spielen eingesetzt werden. (https://elevenlabs.io/)

Eleven Labs Audio Native

Eleven Labs Audio Native – Einbettbarer Audioplayer zur automatischen Sprachausgabe

Audio Native von Eleven Labs liest Blogartikel oder News-Webseiten automatisch vor. Betreiber können den Audioplayer in ihre Seite integrieren, damit Besucher die Inhalte anhören statt lesen. (https://elevenlabs.io/blog/audio-native/)

Handy

Lokale KI zur Aufnahme von Sprache und Umwandeln in Text.

Die Anwendung Handy von handy.computer ist eine kostenlose und Open-Source-App für Sprach-zu-Text. Hier die wichtigsten Funktionen und Leistungen in Kurzform: Sprach-zu-Text in beliebigen Textfeldern → Du kannst in jedes Eingabefeld sprechen, und Handy transkribiert deine Sprache direkt als Text. Push-to-Talk-Modus → Standardmäßig aktiv: Halte eine Tastenkombination gedrückt, sprich, und beim Loslassen wird der Text übertragen. Alternativ lässt sich ein Start/Stopp-Modus einstellen. Individuelle Tastenkombinationen → Frei konfigurierbar, z. B. „Strg+Z“ oder andere Shortcuts, um die Transkription zu starten/stoppen. Lokale Verarbeitung → Deine Stimme bleibt auf deinem Computer, es wird nichts in die Cloud geschickt. Datenschutzfreundlich und privat. Barrierefreiheit → Entwickelt, um Sprachsteuerung und Transkription für alle zugänglich zu machen – ohne Bezahlschranke. Open Source & erweiterbar → Jeder kann die Software anpassen, erweitern oder zur Weiterentwicklung beitragen. Plattformunterstützung → Verfügbar für Windows und weitere Systeme, mit einfacher Installation. Damit ist Handy vor allem ein leichtgewichtiges, datenschutzfreundliches Tool, das Sprache schnell und unkompliziert in Text verwandelt – ideal für Barrierefreiheit, Produktivität oder einfach bequemes Diktieren.

Murf.AI

20 Tools verfügbar

20

AugXLabs

AugXLabs – KI-gestütztes Tool zur automatischen Videogenerierung

AugXLabs verwandelt Skripte, Audioaufnahmen oder Webcam-Videos in fertige Clips. Anpassungen lassen sich nachträglich in einer benutzerfreundlichen Oberfläche vornehmen, sodass auch Anfänger professionelle Resultate erzielen. (https://www.augxlabs.com/)

FireCut AI

FireCut AI – KI-basiertes Videoschnitt-Plugin für Adobe Premiere Pro

FireCut AI erleichtert den Videoschnitt in Premiere Pro durch automatische Erkennung von Sprechpausen und Stille. Podcasts lassen sich in Sekundenschnelle bearbeiten, Kameraansichten wechseln oder Zooms automatisch hinzufügen. (https://firecut.ai/)

Gemoo Produktzentrum

Gemoo – KI-basiertes Produktzentrum für Videoerstellung, Optimierung und Cloud-Services

Gemoo bündelt mehrere KI-Tools, die von Intro-/Outro-Vorlagen bis zur automatischen Titel- und Tag-Generierung reichen. Anwender können Bildschirmaufnahmen in ansprechende Videos verwandeln oder unerwünschte Objekte entfernen. (https://gemoo.com/)

GoEnhance.ai/ Seaweed AI

hochmoderne KI-Videogenerierungsmodell von ByteDance

Seaweed ist das hochmoderne KI-Videogenerierungsmodell von ByteDance, das mit PixelDance zusammenarbeitet. Dieses leistungsstarke Tool erstellt hochwertige, realistische Videos in verschiedenen Stilen und bietet vielseitige kreative Möglichkeiten.

Invideo.AI

InVideo AI – KI-gestützte Videoproduktion aus Text

InVideo AI wandelt beliebige Texte in ansprechende Videoclips um. Verschiedene Vorlagen, Stile und Layouts stehen zur Verfügung, um Werbe-, Erklär- oder Social-Media-Videos schnell zu erstellen. (https://invideo.io/ai/)

LTX Studio

LTX Studio – KI-gestützte Film- und Character-Animationserstellung

LTX Studio ermöglicht das Erstellen kompletter Filme mithilfe von Storyboards, Charakteranimationen und automatischer Szenenübergänge. Die KI vereinfacht den kreativen Prozess für Filmemacher und Content Creator. (https://ltx.studio/)

Mochi 1

Mochi 1 – Open-Source-KI-Modell zur Videogenerierung von Genmo

Mochi 1 ist ein frei verfügbares Videogenerierungsmodell, das flüssige Bewegungen und realistische Szenen ermöglicht. Nutzer können es per Textprompt steuern und so animierte Sequenzen erstellen. (https://www.genmo.ai/)

Moonvalley

Moonvalley – KI-gestützte Videoerstellung und -animation über Discord

Moonvalley erlaubt es, Texte, Skripte oder Bilder per Discord zu Videos zu verarbeiten. Nutzer können Figuren animieren, Szenen erstellen und Stilrichtungen ändern, um kreative Filmprojekte zu realisieren. (https://moonvalley.ai/)

Opus Clip

Opus Clip – KI-gestütztes Video-Kürzungstool

Opus Clip analysiert längere Videoinhalte und erstellt daraus automatisch verschiedene kurze Clips, die sich ideal für Reels, Shorts oder TikTok eignen. Das Tool identifiziert relevante Szenen und schneidet sie passend zurecht. (https://www.opus.pro/)

ProPainter

ProPainter – KI-gestützte Videobearbeitung und Inpainting

ProPainter entfernt unerwünschte Objekte oder vervollständigt fehlende Bereiche in Videos. Objekte können maskiert, aus dem Video entfernt oder Outpainting-Effekte erzeugt werden. (https://shangchenzhou.com/projects/ProPainter/)

Runway Gen-4

60 Sekunden Videos erstellen. Auch über ComfyUi lokal möglich

60-second AI video generation just got unlocked! LTXV is the first model to generate native long-form video, with controllability that beats every open source model. - 8× longer than typical gen video - 10–100× faster & cheaper - Runs even on consumer GPUs - Pose, depth & control LoRAs supported

Steve.AI

Steve.AI – KI-basierte Video- und Animationsplattform

Steve.AI ist eine Online-Software zur schnellen Erstellung von Videos und Animationen. Nutzer geben einfach Skripte oder Texte ein, und die KI generiert daraus ansprechende Clips. Besonders hilfreich für Social-Media- und Marketing-Kampagnen. (https://accounts.animaker.com/login/steveai/)

Steve.AI

Steve.AI (Deepmake) – KI-gestützte Videoerstellung mit Stable Diffusion und Face Swapping

Diese Version von Steve.AI integriert Stable-Diffusion-Algorithmen zur Videogenerierung. Sie ermöglicht automatisches Segmentieren von Videoebenen, Face Swapping und Upscaling, um vielseitige Effekte zu erzielen. (https://deepmake.com/)

Synthesia.IO

Synthesia – KI-gestützte Videoproduktion mit Avataren

Synthesia wandelt Text in über 120 Sprachen in gesprochene Videos um und bietet über 125 KI-Avatare zur Auswahl. Ohne Kamera oder Videobearbeitungskenntnisse lassen sich in wenigen Minuten professionelle Clips erstellen. (https://www.synthesia.io/)

Timebolt

Timebolt – KI-Tool zum automatischen Entfernen von Stille in Videos und Podcasts

Timebolt erkennt Sprechpausen oder stille Passagen in Video- oder Audiodateien und entfernt sie automatisiert. Dadurch werden Aufnahmen effizient gekürzt und dynamischer. (https://www.timebolt.io/)

Topview

Topview – KI-basiertes Video-Tool für virale Kurzvideos

Topview.ai verwandelt Links oder Medien in kürzester Zeit in ansprechende Kurzvideos. Eine integrierte Datenbank mit erfolgreichen YouTube- und TikTok-Videos liefert Inspiration für erfolgreiche Inhalte. (https://www.topview.ai/)

Video to blog

Die Anwendung VideoToBlog.ai wandelt Videos, Podcasts oder Webinare automatisch in professionelle Blogartikel um. Mit nur einem Link oder Upload erstellt die KI innerhalb weniger Minuten einen strukturierten, SEO-optimierten Beitrag – inklusive Screenshots, Links und Call-to-Actions. Ziel ist es, Content effizient zu repurposen und die Reichweite zu erhöhen

Funktionsübersicht mit Erklärungen Video- und Audio-Umwandlung Wandelt YouTube-Videos, hochgeladene Video- oder Audio-Dateien direkt in Blogartikel um. Voraussetzung: gesprochene Sprache im Inhalt. Schnelle Generierung Erstellt in weniger als einer Minute einen fertigen Blogpost – sofort bereit zur Veröffentlichung. Mehrsprachigkeit (30+ Sprachen) Unterstützt über 30 Sprachen, unabhängig von der Originalsprache des Videos. Authentische KI-Texte Die KI imitiert den Ton und Stil des Sprechers, sodass die Artikel wie „echte“ Texte wirken. Strukturierte Artikel Automatische Gliederung mit Überschriften, Zusammenfassungen und Highlights für bessere Lesbarkeit. SEO-Optimierung Beiträge werden automatisch für Suchmaschinen optimiert – inklusive Keywords, Metadaten und interner Verlinkung. Smart Screenshots Automatische Screenshots aus dem Video werden eingefügt, um Inhalte visuell zu unterstützen. Smart Links Fügt relevante interne und externe Links hinzu, um SEO und Nutzerbindung zu stärken. Call-to-Actions (CTAs) Generiert ansprechende Handlungsaufforderungen, die Klicks, Anmeldungen oder Verkäufe fördern. Integrationen Export direkt ins CMS, als PDF oder HTML/Markdown. Auch Zapier-Integration für automatisierte Workflows. Website & Newsletter Builder Falls keine eigene Website vorhanden ist, können Blogposts direkt auf einer VideoToBlog-Publikation gehostet und mit einem Newsletter verbunden werden. Automatisierung Automatische Blogpost-Erstellung bei neuen YouTube-Uploads oder Weiterleitung direkt an Website/Newsletter. Vorlagen & Anpassungen Individuelle Templates für Ton, Stil und Struktur, angepasst an die eigene Marke. Team-Funktion Möglichkeit, Teammitglieder hinzuzufügen und gemeinsam Inhalte zu verwalten. Kosteneffizienz Spart bis zu 95 % gegenüber Freelancern und reduziert den Zeitaufwand um durchschnittlich 10 Stunden pro Woche

Vimeo

Vimeo – KI-unterstützte Videoplattform mit Schnitt- und Transkriptionsfunktionen

Vimeo bietet neben dem klassischen Video-Hosting ein KI-gestütztes Skript-Tool, Auto-Transkriptionen und einen benutzerfreundlichen Video-Editor. Nutzer können Inhalte hochladen, schneiden und mit interaktiven Elementen ausstatten. (https://vimeo.com/)

Wonder Studio

Wonder Studio – KI-gestützte Videoanimation und Compositing

Wonder Studio animiert automatisch CG-Charaktere und setzt sie in Live-Action-Szenen ein. Die KI übernimmt dabei Beleuchtung, Compositing und Animation, sodass professionelle Film- und Videoprojekte schneller realisiert werden können. (https://wonderdynamics.com/)

Xlabs Github

Xlabs – Open-Source-Videogenerierung und Animation über GitHub

Xlabs bietet das Projekt Deforum X FLUX auf GitHub, mit dem sich KI-gestützte Videos erstellen und animieren lassen. Über das Notebook DEFORUM_FLUX.ipynb können Nutzer Szenen gestalten, Objekte einfügen und verschiedene Stile ausprobieren. (https://github.com/xlabs-ai/deforum-x-flux)

Video Generierung

1 Tool verfügbar

1

Veo3

Our state-of-the-art video generation model

Videos Generieren mit VEO von Google. Veo 3 können Sie Ihren Kreationen Soundeffekte, Umgebungsgeräusche und sogar Dialoge hinzufügen – und so wird das gesamte Audio nativ generiert. Es bietet außerdem erstklassige Qualität und zeichnet sich durch Physik, Realismus und prompte Haftung aus.

Zeitschrift

3 Tools verfügbar

3

Chip Computerzeitschrift

. Monatliche CHIP‑Ausgabe (Print oder Digital) Vollständige Ausgabe der Zeitschrift (Hardware‑Tests, Software‑Tipps, Sicherheits‑Themen, Praxis‑Ratgeber). Je nach Aboform: Print, Digital‑PDF, oder Kombi.

CHIP‑DVD‑Version mit Software‑Vollversionen, Tools, Treibern, System‑Utilities über Download‑Portal statt physischer DVD. Exklusive Testberichte & Kaufberatungen Sicherheits‑ und Datenschutz‑Ratgeber

Stiftung Warentest Finanzen

Stiftung Warentest Finanzen (früher Finanztest) ist ein unabhängiges Verbrauchermagazin, das monatlich erscheint und fundierte Informationen rund um Geld, Versicherungen und Finanzentscheidungen bietet.

Tests & Vergleiche von Finanzprodukten Versicherungen, Geldanlagen, Kredite, Baufinanzierungen, Fonds, Sparangebote – alles unabhängig und anzeigenfrei getestet. Ratgeber & Hintergrundberichte Verständliche Erklärungen zu Steuern, Recht, Altersvorsorge, Immobilien, Gesundheit und Versicherungen. Monatliche Marktübersichten Zinsvergleiche, Fondsratings, Kreditkonditionen und weitere regelmäßig aktualisierte Finanzdaten. Spezialhefte & Jahresausgaben Mehrmals jährlich erscheinen Finanztest Spezial‑Hefte zu Themen wie Steuern, Immobilien, Altersvorsorge oder Versicherungen sowie ein Jahresbuch mit allen Tests in Kurzform. Online‑Inhalte Alle Tests und Berichte sind auch digital abrufbar (teilweise kostenpflichtig)

Stiftung Warentest Flatrate Testberichte Online

Vollzugriff auf alle Tests & Artikel Unbegrenzter Zugang zu sämtlichen Produkttests (z. B. Staubsauger, Smartwatches, Versicherungen, Finanzprodukte). Zugriff auf alle Ratgeber, Hintergrundberichte und Marktübersichten. Keine zusätzlichen Kosten pro Test.

Zugriff auf aktuelle Bestseller‑Inhalte Direkt auf der Startseite werden dir beliebte und neue Inhalte angezeigt, z. B.: Staubsauger‑Tests Smartwatch‑Tests Fonds‑ und ETF‑Vergleiche Versicherungsvergleiche (z. B. Wohngebäudeversicherung) 3. Finanz‑Tools & Portfolio‑Hilfen Zugang zum Pantoffel‑Portfolio, einem einfachen, wartungsarmen Anlagekonzept der Stiftung Warentest. Schritt‑für‑Schritt‑Anleitungen zur Geldanlage – auch für Einsteiger. 4. Newsletter‑Vorteile Optionaler Newsletter mit neuen Tests, Spartipps und Expertentipps direkt ins Postfach. Personalisierte Empfehlungen basierend auf deinen Interessen. 5. Komfortfunktionen & Service Abo‑Serviceportal zur Verwaltung deiner Flatrate. Kontaktmöglichkeiten per E‑Mail und Telefon. Zugriff auf Archiv, Themen‑A‑Z, RSS‑Feeds und Push‑Benachrichtigungen.

Schnellzugriff

# Favoriten

API-Schnittstellen

Assistant

Assistant, Automatisierung

Assistant, Automatisierung, Agent

Assistant, Automatisierung, Datenbank, Recherche

Assistant, Business-Intelligence, Präsentation

Assistant, Sprache

Assistant, Video, Character

Automatisierung

Automatisierung, Assistant, Programmieren

Automatisierung, Business-Intelligence

Automatisierung, Erweiterung

Automatisierung, KI-Entwicklung

Automatisierung, Lernen, Bilder

Automatisierung, Programmieren, ChatBot

Automatisierung, Projektmanagement

Automatisierung, Video

Bilder

Bilder, Präsentation

Bilder, Video

Bilder, Video, Automatisierung

Character

Character, ChatBot

Character, Sprache

Character, Video, Text zu Sprache

ChatBot

Chatbot Builder

ChatBot lokal

ChatBot lokal webbasiert

ChatBot, Assistant

ChatBot, Assistant, Bilder

ChatBot, Automatisierung

ChatBot, Erweiterung

ChatBot, Erweiterung, Assistant

ChatBot, Erweiterung, Assistant, Programmieren, Mindmap

ChatBot, Suche

ChatBot, UserChatBot

Datenbank

Fernsehen

Hörbücher

Hyper Write

KI-Entwicklung, Programmieren

Meeting

Mindmap, Automatisierung, Präsentation

Musik

Musik, Sprache

Podcast

Präsentation

Programmieren

Programmieren, Folien erstellen, Bilder, Tabellenkalkulation, Video, Audio

Programmieren, KI-Entwicklung

Recherche

Recherche, Sprache, Suche

Reisen

Social Media

Sprache

Sprache, Lernen

Sprache, Übersetzung

Suche

Suche, API

Übersetzung

Übersetzung, Sprache

User Chatbot PDF-Chatbot

Video

Video Generierung

Zeitschrift