Auflistung von KI-spezifischen Informationsquellen: Kategorie quellen
### Allgemeine Stärken von Perplexity AI (relevant für beide Versionen, aber Pro verstärkt sie) * **Quellenbasierte Antworten:** Jede Antwort wird mit Verweisen auf die verwendeten Quellen geliefert, was die Überprüfung und Vertrauenswürdigkeit erhöht. * **Zusammenfassungen:** Fähigkeit, komplexe Informationen aus verschiedenen Quellen zu synthetisieren und prägnant zusammenzufassen. * **Natürliche Sprachverarbeitung:** Versteht komplexe Fragen und kann in einem dialogischen Format interagieren. * **Breite Themenabdeckung:** Kann zu einer Vielzahl von Themen Informationen liefern. * **Lern- und Forschungsunterstützung:** Ideal zum schnellen Erfassen neuer Themen oder zur Vertiefung bestehenden Wissens. --- ### Kostenlose Version: Grundlegende Informationsbeschaffung Die kostenlose Version von Perplexity AI ist ideal für Gelegenheitsnutzer, die schnelle und quellengestützte Antworten auf ihre Fragen suchen. **Wichtige Anwendungsmöglichkeiten:** 1. **Beantwortung von allgemeinen Fragen:** Schnelle Suche und Beantwortung von Faktenfragen oder Erklärungen zu gängigen Themen (z.B., "Was ist die Relativitätstheorie?", "Wie funktioniert Photosynthese?"). 2. **Kurze Zusammenfassungen:** Erstellen von kurzen Zusammenfassungen von Artikeln oder Themen, die im Web gefunden werden. 3. **Einfache Recherche:** Startpunkt für Recherchen, um einen Überblick über ein Thema zu erhalten und erste Quellen zu identifizieren. 4. **Verständnis von Konzepten:** Erklärenlassen von komplexen Begriffen oder Prozessen in verständlicher Sprache. 5. **Grundlegendes Brainstorming:** Erste Ideenfindung oder Stichwortsammlung zu einem Thema. **Einschränkungen der kostenlosen Version (und damit der Anwendungsmöglichkeiten):** * **Begrenzte Copilot-Anfragen:** Nur sehr wenige Copilot-Anfragen pro Tag (z.B. 5 pro 4 Stunden), was die interaktive, tiefergehende Recherche einschränkt. * **Standard-KI-Modelle:** Zugriff auf weniger leistungsstarke KI-Modelle (oft Perplexity-eigenes Modell, vergleichbar mit GPT-3.5), was zu weniger nuancierten oder präzisen Antworten führen kann. * **Keine oder eingeschränkte Medien-Uploads:** Das Hochladen und Analysieren von PDFs, Bildern oder anderen Dateitypen ist nicht oder nur sehr begrenzt möglich. * **Keine Bildgenerierung:** Die Erstellung von Bildern ist nicht enthalten. --- ### Kostenpflichtige Pro Version: Erweiterte Recherche, Analyse und Content-Erstellung Die Pro-Version hebt die Möglichkeiten auf ein professionelles Niveau und ist für Power-User, Forscher, Studenten, Content Creator und Business-Anwender konzipiert. **Wichtige Anwendungsmöglichkeiten:** 1. **Tiefgehende und komplexe Forschung:** Durchführung umfassender Recherchen für wissenschaftliche Arbeiten, Marktanalysen oder technische Dokumentationen dank Zugang zu den neuesten und leistungsstärksten KI-Modellen (GPT-4, Claude 3, Sonar, Llama 3) und deutlich mehr Copilot-Anfragen. 2. **Inhaltsanalyse von Dokumenten (PDFs, Bilder):** Hochladen und Analysieren von eigenen Dateien (PDFs, Word-Dokumente, Bilder etc.) zur Extraktion von Informationen, Zusammenfassungen, Beantwortung von Fragen zum Inhalt oder zur Transkription von Text aus Bildern. 3. **Erstellung von detaillierten Berichten und Texten:** Generierung von Entwürfen für E-Mails, Berichte, Artikel, Blogposts oder Drehbücher in hoher Qualität und mit spezifischem Stil. 4. **Kreatives Schreiben und Brainstorming:** Unterstützung bei kreativen Prozessen durch hochwertige Textgenerierung, Ideenfindung und Storytelling. 5. **Softwareentwicklung und technische Unterstützung:** Erklären von Code-Snippets, Debugging, Generierung von Code-Beispielen oder Erläuterung komplexer technischer Konzepte mit präzisen und aktuellen Informationen. 6. **Trendanalyse und Marktübersichten:** Schnelle Erstellung von Zusammenfassungen über aktuelle Trends in spezifischen Industrien oder Nischen, unterstützt durch erweiterte Fokus-Optionen (z.B. "Academic", "YouTube", "Reddit", "WolframAlpha"). 7. **Bildgenerierung:** Erstellung von Bildern basierend auf Textbeschreibungen, nützlich für Content Creator, Marketing oder Präsentationen. 8. **Personalisierte Lernpfade:** Tiefergehende Erforschung von Lernthemen, Erstellung von Übungsfragen oder detaillierten Erklärungen, die auf den individuellen Lernbedarf zugeschnitten sind. 9. **API-Zugang (für Entwickler):** Integration der Perplexity-Fähigkeiten in eigene Anwendungen oder Workflows. **Vorteile der Pro-Version (die diese Anwendungen ermöglichen):** * **Zugriff auf Top-KI-Modelle:** Nutzung von Modellen wie GPT-4, Claude 3 Opus/Sonnet, Sonar und Llama 3, die komplexere Anfragen besser verstehen und nuanciertere Antworten liefern. * **Deutlich mehr Copilot-Anfragen:** Ermöglicht Hunderte von interaktiven, quellengestützten Anfragen pro Tag (z.B. 600 Anfragen pro Tag), was eine viel tiefere Exploration von Themen erlaubt. * **Unbegrenzte Dateiuploads:** Ermöglicht die Analyse von umfangreichen Dokumenten und Bildern. * **Erweiterte Fokus-Optionen:** Präzisere Eingrenzung der Suchbereiche, um relevantere Ergebnisse zu erzielen (z.B. nur akademische Quellen, YouTube-Videos, Reddit-Diskussionen). * **Schnellere Antwortzeiten:** Oft priorisierte Verarbeitung der Anfragen. --- **Fazit:** Die **kostenlose Version** von Perplexity AI ist ein hervorragendes Werkzeug für die **schnelle, quellengestützte Informationsbeschaffung** und das Verständnis grundlegender Konzepte. Sie ist ideal für den Alltagsgebrauch und erste Recherchen. Die **kostenpflichtige Pro-Version** ist ein unverzichtbares Tool für alle, die **tiefgehende Analysen, umfassende Recherchen, hochwertige Content-Erstellung** oder die Analyse von eigenen Dokumenten benötigen. Sie bietet die volle Leistung der modernsten KI-Modelle und ermöglicht ein deutlich effizienteres und professionelleres Arbeiten in nahezu jedem Bereich, der Informationsverarbeitung und Textgenerierung erfordert.
Zusatzinfos: 251009:Neuerungen: Neueste Produktänderungen und Funktionen Einführung von Deep Research: Dies ist ein neuer Modus, der umfassende Analysen automatisch durchführt. Perplexity sucht und bewertet Hunderte von Quellen und erstellt einen strukturierten Bericht, beispielsweise für Finanzen, Marketing oder technologische Recherchen. Deep Research ist für alle Nutzer kostenfrei verfügbar, für Pro-Abonnenten gibt es unbegrenzte Anfragen. Perplexity führt bei der Deep Research-Funktion Dutzende Suchanfragen durch, liest Hunderte Quellen und liefert eine umfassende, autonom generierte Auswertung. Das Feature ist insbesondere für Expertenanalysen und tiefgehende Themen geeignet. Perplexity Search API: Neu verfügbare API, die Zugang zur gleichen Infrastruktur bietet, die das Perplexity-Antwortsystem antreibt. Damit lassen sich großskalierte Suchanfragen programmatisch und in Echtzeit ausführen – wichtig für Entwickler, die auf aktuelle Webdaten zugreifen möchten. Die neue Search API ermöglicht den Zugriff auf Hunderte Milliarden Webseiten und bietet strukturierte, für KI-Anwendungen optimierte Antworten. Geschwindigkeit und Aktualität der Daten stehen dabei im Fokus. Unterstützung neuester KI-Modelle: Pro-Nutzer können mit den modernsten verfügbaren Modellen arbeiten, u.a. OpenAI GPT-5, Claude 4.5 Sonnet, Google Gemini 2.5 Pro sowie Sonar Large (Llama 3.1-basiert). Diese Modelle zeichnen sich durch verbesserte Geschwindigkeit, Genauigkeit und Multimodalität aus. Verbesserte Echtzeitbeantwortung: Perplexity entscheidet nun noch zuverlässiger, wann eine Internetsuche für aktuelle Informationen erforderlich ist und liefert besser zugeschnittene Ergebnisse zu aktuellen Ereignissen. Image Generation & Editing: Bilder können nun durch Anfragen generiert und bearbeitet werden, wodurch die Plattform noch kreativer genutzt werden kann.

**Für wen:** * **Entwickler:** Die generative KI in ihre eigenen Anwendungen integrieren möchten. * **Unternehmen:** Die maßgeschneiderte KI-Lösungen entwickeln wollen. * **Forscher:** Die mit den neuesten KI-Modellen experimentieren möchten. **Zweck:** * **Prototyping:** Schnelles Erstellen und Testen von Prompts und Modellanfragen. * **Anwendungsentwicklung:** Zugang zu den Gemini APIs, um KI-Funktionen in eigene Apps, Dienste oder Produkte einzubauen (z.B. Chatbots, Inhaltsgeneratoren, intelligente Assistenten). * **Feinabstimmung:** Möglichkeit, Modelle mit eigenen Daten anzupassen (zukünftige oder erweiterte Funktionen). * **Exploration:** Experimentieren mit verschiedenen Gemini-Modellen und deren Fähigkeiten. **Interaktionsweise:** Primär durch eine grafische Benutzeroberfläche zur Prompt-Erstellung, aber mit dem Endziel, Code-Snippets zu generieren (Python, Node.js, Go, Dart), die dann in eine eigene Anwendung integriert werden können. Es geht darum, die *Grundlage* für KI-gesteuerte Funktionen zu schaffen. **Kosten:** Die Nutzung von Google AI Studio selbst ist kostenlos. Es können jedoch Kosten für die Nutzung der zugrunde liegenden Gemini APIs anfallen, insbesondere bei hohen Anfragenzahlen, die über die kostenlosen Kontingente hinausgehen (Google Cloud Preismodell).
Zusatzinfos:

Gemini App Mit Gemini App meisterst du selbst die komplexesten Projekte. Mit deinem Google AI Pro-Abo hast du Zugriff auf unsere leistungsstärksten Modelle und neue leistungsfähige Funktionen. Gemini in Gmail, Docs und mehr Mit einem einfachen Prompt erhältst du Hilfe beim Verfassen von Einladungen und Lebensläufen, beim Erstellen und Strukturieren von Tabellen und bei vielem mehr – dank KI‑basierter Tools, die in Gmail, Google Docs, Google Sheets und weiteren Google-Apps verfügbar sind. Mit deinem Abo erhältst du 2 TB Speicherplatz für Google Drive, Gmail und Google Fotos. Speicherplatz teilen: Gemeinsamer Speicherplatz über die Familienfreigabe Jedes Mitglied einer Familiengruppe hat ein eigenes Google-Konto mit jeweils 15 GB Speicherplatz. Hat ein Mitglied seine 15 GB aufgebraucht, kann es den von dir freigegebenen zusätzlichen Speicherplatz nutzen. Quelle: https://one.google.com/u/1/benefits/83e753238b9ff66e55a5e4e0318ce844?g1_landing_page=3&utm_source=g1&utm_medium=email&utm_campaign=welcome_member&utm_id=20077973 Kontextfenster mit 1 Million Tokens Mit dem extragroßen Kontextfenster kann das Modell viel mehr Informationen verarbeiten und verstehen (PDFs mit bis zu 1.500 Seiten), sodass es dir schnell bei noch komplexeren Aufgaben helfen kann.
Zusatzinfos:

Notebook LM erlaubt das Hochladen von Vorlesungsaufzeichnungen, Lehrbuchkapiteln und Forschungsarbeiten. Die KI erklärt komplexe Konzepte, liefert Beispiele und kann Videos oder Podcasts zusammenfassen. (https://notebooklm.google.com/). Mit dem Pro-Abo (21,99 Euro/Monat) zusätzlich: NotebookLM Erstelle 5‑Mal so viele Audio-Zusammenfassungen, Notebooks und Quellen pro Notebook Mit höheren Limits können Informationen zu vielen verschiedenen Themen und aus verschiedenen Quellen leichter verarbeitet werden, während du gleichzeitig die Flexibilität hast, die Details in den Bereichen, die du vertiefen möchtest, zu erkunden. Passe Stil und Ton der Notebooks an Du kannst die Länge der Antworten und der Tonfall nach Belieben angepassen, unabhängig davon, ob du Hilfe von einem Forschungsassistenten oder einem persönlichen Tutors brauchst. Mit anderen zusammenarbeiten und Notebooks teilen Du kannst ein Notebook mit einem Mitschüler, Partner, Freund oder Familienmitglied teilen. So werden sie von anderen in der Community verwendet.
Zusatzinfos:
Link auf Notebook LM von Google

Heygen erzeugt in wenigen Minuten sprechende Avatar-Videos aus Text. Man kann entweder fertige Avatare verwenden oder ein eigenes Video als Vorlage hochladen. Das Tool bietet auch ein ChatGPT-Plugin und kann personalisierte Avatar-Videos erstellen. (https://www.heygen.com/)
Zusatzinfos:

Numerous.ai generiert Formeln, erstellt Texte für mehrere Zeilen und passt Daten an. Das Tool funktioniert sowohl mit Google Sheets als auch Excel, um repetitive Aufgaben zu automatisieren und Datenauswertungen zu beschleunigen. (https://numerous.ai/)
Zusatzinfos:

Browse.AI extrahiert Daten von beliebigen Websites und überwacht Veränderungen in Echtzeit. Nutzer können strukturierte Datensätze erhalten und sich bei Updates benachrichtigen lassen. (https://www.browse.ai/)
Zusatzinfos: Account und 50 Credits free. Dann 19 Dollar/Month

Datamotto übernimmt die Bereinigung, Anreicherung und Transformation von Rohdaten. Das Tool füllt fehlende Werte auf, kategorisiert Textspalten oder führt Feature-Engineering durch, um Analysen zu erleichtern. (https://datamotto.com/)
Zusatzinfos: Freie Demoversion

1. Zugriff auf Tausende KI-Modelle Text-zu-Bild (z. B. Flux, Seedream, Ideogram) Bildbearbeitung und -restaurierung Sprach- und Musikgenerierung Videoerstellung aus Text oder Bildern (z. B. OpenAI Sora, Pixverse) Nutzung von LLMs (z. B. GPT-5 Pro, Claude 4.5 Sonnet) 2. Einfache Integration per API Nur eine Codezeile nötig, um ein Modell auszuführen Unterstützung für Node.js, Python und HTTP-Requests Beispiel: javascript const replicate = new Replicate({ auth: process.env.REPLICATE_API_TOKEN }); const output = await replicate.run("black-forest-labs/flux-pro", { input: { prompt: "an abstract painting of a sunrise" } }); 3. Eigene Modelle trainieren und bereitstellen Möglichkeit zur Feinabstimmung bestehender Modelle mit eigenen Daten Deployment eigener Modelle mit Cog, einem Open-Source-Tool für ML-Containerisierung 4. Skalierbarkeit & Kostenkontrolle Automatische Skalierung je nach Traffic Abrechnung nur für tatsächliche Rechenzeit Unterstützung für verschiedene GPU-Typen (z. B. Nvidia T4, A100) 5. Monitoring & Logging Echtzeit-Metriken und Logs zur Modellüberwachung und Fehleranalyse
Zusatzinfos:

Funktionen: Tausende Vorlagen für Flyer, Posts, Reels, Präsentationen etc. Intuitive Bearbeitung: Texte animieren, Hintergründe entfernen, Farben anpassen Integration von Adobe Stock & Adobe Fonts Export für verschiedene Plattformen (Instagram, TikTok, YouTube etc.) Firefly ist integriert: Du kannst direkt KI-generierte Bilder/Text-Effekte nutzen
Zusatzinfos:

DALL-E ist ein KI-basiertes Tool zur Bilderzeugung, das aus rein textbasierten Eingaben eigenständig kreative und realistische Motive generiert. Die Anwendung unterstützt vielfältige Stile – von einfachen Zeichnungen bis hin zu fotorealistischen Kompositionen – und ermöglicht Nutzern, durch kurze Beschreibungen schnell individuelle Bilder zu erstellen. Mit Hilfe modernster Deep-Learning-Algorithmen interpretiert DALL-E Begriffe, Szenen und Objekte, um originelle Resultate zu liefern, die sich für künstlerische, werbliche oder pädagogische Zwecke eignen. (https://labs.openai.com/)
Zusatzinfos:

Midjourney ist eine KI-gestützte Bildgenerierungsanwendung, die sich auf fotorealistische Darstellungen durch beschreibende Texteingaben spezialisiert hat. Nutzer interagieren in der Regel über Discord, wo sie kurze Befehle oder ausführliche Textprompts eingeben, um detailreiche und künstlerisch anspruchsvolle Bilder zu erstellen. Die Anwendung bietet umfangreiche Stiloptionen und nutzt fortschrittliche Algorithmen, um Szenen, Charaktere und Objekte lebensecht abzubilden. So entstehen hochqualitative Ergebnisse, die in Design, Kunstprojekten oder Marketingkampagnen zum Einsatz kommen können. (https://discord.com/channels/662267976984297473/952771221915840552)
Zusatzinfos: /settings für Einstellungen, z.B. Version 6 oder Raw Style. Eintragungen nach dem Prompt: Leerzeichen, dann --ar 16:9 --style raw --v 6.0 Gleiche Bilder: Bilder erstellen. Neben dem Prompt auf die drei Punkte klicken. Reaktion hinzufügen und envelope in die Suche. Dann auf Mailkarte klicken und der Seed wird im Prompt angezeigt. Dann Prompt kopieren, in Eingabe einfügen und --seed mit dem kopierten seed hinzufügen. Oder auf V1-4 klicken und den Prompt ändern.

Stable Diffusion ist ein leistungsstarkes KI-Modell zur Generierung fotorealistischer Bilder anhand textbasierter Eingaben. Die Anwendung unterstützt vielfältige Themen und Stile und ermöglicht eine detailreiche Umsetzung von Nutzerideen. Ein kostenloses Kontingent an Bildgenerierungen (z. B. 10 Credits) steht nach Anmeldung zur Verfügung, sodass Nutzer erste Entwürfe direkt testen können. Dank fortschrittlicher Diffusionstechnologie werden hochqualitative Resultate erzeugt, die sich für kreative Projekte, Produktvisualisierungen oder künstlerische Arbeiten eignen. (https://stablediffusionweb.com/)
Zusatzinfos:

LeiaPix ermöglicht das Hochladen von 2D-Bildern und konvertiert sie mithilfe fortschrittlicher KI-Technologie in dynamische 3D-Bilder. So entstehen visuell ansprechende Inhalte für Marketing, Bildung und Unterhaltung. (https://convert.leiapix.com/)
Zusatzinfos:

DragGAN ermöglicht das gezielte Verformen und Bearbeiten von Bildern, indem Objekte oder Bildbereiche interaktiv gezogen werden. Pose, Form und Ausdruck können präzise angepasst werden, was neue Freiheiten in der Bildmanipulation eröffnet. (https://vcai.mpi-inf.mpg.de/projects/DragGAN/)
Zusatzinfos:

Leonardo.ai generiert Bilder auf Basis kurzer Textbeschreibungen, ähnlich wie Midjourney. Verschiedene Modelle und Stiloptionen ermöglichen eine große Bandbreite an Bildstilen, von fotorealistisch bis künstlerisch. (https://leonardo.ai/)
Zusatzinfos: Viele Bilder

Ideogram 2 zeichnet sich durch die Fähigkeit aus, Texte realistisch in Bilder einzubinden. Nutzer können verschiedene Stile wählen, von realistisch bis abstrakt. Eine Canvas-Funktion ermöglicht zudem das Erweitern und Auffüllen von Bildbereichen. (https://ideogram.ai/login)
Zusatzinfos:

GenMo kann Bilder per Texteingabe erstellen, 3D-Meshes und 360-Grad-Videos generieren sowie hochgeladene Bilder animieren. Nutzer können sogar komplette Filmskripte verfassen und Trailer automatisch erzeugen lassen. (https://www.genmo.ai/)
Zusatzinfos:

Projekt Stardust erkennt Objekte in Bildern automatisch und ermöglicht das Verschieben, Löschen oder Verändern einzelner Elemente. Auch Personen lassen sich aus dem Hintergrund entfernen oder Kleidung anpassen. Aktuell noch in der Beta-Phase. (https://www.theverge.com/2023/10/5/23904416/adobe-max-sneak-project-stardust-ai-photo-editing-tool)
Zusatzinfos:

Leonardo Live Canvas erlaubt es, Bilder in Echtzeit durch Texteingaben zu erstellen und zu verändern. Dank verschiedener KI-Modelle kann der Stil flexibel angepasst werden, von realistisch bis künstlerisch. (https://app.leonardo.ai/)
Zusatzinfos:

DALL·E 3 ist die neueste Generation des textgesteuerten Bildgenerators von OpenAI. Es produziert detailreiche und kreative Motive und ist eng in GPT-4 integriert, um nahtlos zwischen Text- und Bildinhalten zu wechseln. (https://www.openai.com/)
Zusatzinfos: Bei mehreren Bildern: Anweisung n, n-1, n-2, n-3 nutzen, um das Bild im neuen Prompt anzusprechen, welches verändert werden. Soll. N zählt rückwärts. N ist das vierte Bild. Weitere Befehle: full body (ganzer Körper), laying down (liegend), cartoon oder das Gegenteil: ,cinamatic, photorealistic, hyperrealistic, pop off the screen (3D-Efekt) aspect ratio: wide (1729x1024 px; sqare: 1024x1024; tall: 1024.1792px. Oder view ratio: 1:1, 16:9; ChatGPT nach der json-Anweisung fragen, die verwendet wurde. Es sollen der Prompt, size und seed ausgegeben werden.

Clipdrop bietet eine Palette von KI-Funktionen wie Text-to-Image, Bilderweiterung, Cleanup oder Hintergrundentfernung. Nutzer können Objekte austauschen, Schrift entfernen und Beleuchtung anpassen. (https://clipdrop.co/tools)
Zusatzinfos:

SeaArt.AI erstellt Bilder aus Textprompts und bietet die Möglichkeit, vorhandene Bilder als Vorlage zu nutzen. So können Nutzer Motive anpassen oder neue Varianten generieren. (https://www.seaart.ai/)
Zusatzinfos:

Cleanup Pictures erkennt automatisch Personen, Objekte oder Textfragmente in Bildern und entfernt sie nahtlos. Das Ergebnis wirkt, als hätte das unerwünschte Element nie existiert. (https://cleanup.pictures/)
Zusatzinfos: Auch ohne Acoount und dann frei für unlimited pictures, Resolution limited to 720 p. Ab 3 Dollar/Monat für unlimited resolution, high quality refiner

Lexica bietet eine umfangreiche Datenbank an KI-generierten Bildern, die nach Stichworten durchsucht werden kann. Zusätzlich können Nutzer eigene Prompts eingeben, um neue Bilder zu erzeugen. (https://lexica.art/)
Zusatzinfos: Account erforderlich. Große Auswahl an bereits erstellten Bilden. Suchfunktion

WatermarkRemover.AI beseitigt unerwünschte Wasserzeichen aus Bildern mithilfe künstlicher Intelligenz. Das Tool unterstützt verschiedene Bildformate und Auflösungen bis zu 5000 x 5000 Pixel. (https://watermarkremover.ai/)
Zusatzinfos:

PromptHero bietet Millionen von KI-generierten Kunstwerken, die nach Modellen wie Stable Diffusion oder Midjourney gefiltert werden können. Nutzer finden hier Inspiration für eigene Prompts oder teilen ihre Ergebnisse. (https://prompthero.com/)
Zusatzinfos: Viele Bilder und Modelle

FLUX 1.1 generiert realistische und kreative Bilder mithilfe modernster Deep-Learning-Techniken. Das Modell arbeitet schneller und benötigt weniger Ressourcen als frühere Versionen. (https://blackforestlabs.ai/)
Zusatzinfos:

Midjourney Web ermöglicht das Erstellen fotorealistischer oder künstlerischer Bilder ohne Discord. Nutzer erhalten 25 kostenlose Bildgenerierungen und können ihre Prompt-Historie bequem im Browser verwalten. (https://www.midjourney.com/home)
Zusatzinfos:

FLUX Pro über glif.app erstellt realistische Bilder auf Textbasis. Anwender können Prompt-Beispiele nutzen oder eigene Ideen eingeben. 20 Bilder pro Tag sind kostenfrei verfügbar. (https://glif.app/glifs)
Zusatzinfos:
Link auf FLUX Pro über glif.app

April 2025: Bildgenerierung auf einem neuen Level. Im Promptfenster auf die drei Punkte klicken und Create Image auswählen. Dann entweder Bilder(er) als Vorlage hochladen und Prompt eingeben oder reinen Prompt eingeben. Erstelltes Bild kann weiter bearbeitet werden. Bereiche markieren, Inpainting Funktion nutzen. Sora oben links über Button aufrufen. Unterhalb Prompteingabe Bildgröße wählen, Anzahl der auszugebenden Bilder, Preset auswählen oder ein eigenes Preset als Vorlage anlegen. Image creation, now in Sora Create accurate, detailed images using just a phrase. Powered by 4o image generation.
Zusatzinfos: Video auf https://www.youtube.com/watch?v=NbekwvGlXGs&t=602s

Microsoft Designer ist eine KI-gestützte Design-Anwendung, die sich auf die Erstellung und Optimierung visueller Inhalte spezialisiert hat. Die Anwendung bietet Funktionen wie Text-zu-Bild-Generierung, automatische Layout-Optimierung, vielfältige Design-Vorlagen sowie Anpassungen in Farbe, Typografie und Bildbearbeitung. Sie ermöglicht die Erstellung von Grafiken für Social Media, Präsentationen und Marketingmaterialien und integriert zudem Stock-Bilder. Dank der intuitiven Benutzeroberfläche und modernster KI-Technologien können Nutzer trendgerechte und markenkonforme Designs effizient realisieren.
Zusatzinfos:

Gamma.app erzeugt in kurzer Zeit Präsentationen, Websites oder Dokumente anhand von Textvorgaben. Dank leistungsstarker KI-Generatoren können Nutzer binnen Minuten erste Entwürfe erstellen und anschließend individuell verfeinern. Kostenfrei stehen 400 Credits zur Verfügung, danach sind kostenpflichtige Modelle verfügbar. (https://gamma.app/)
Zusatzinfos:

Canva ermöglicht das Erstellen von Designs, Präsentationen und Bildbearbeitungen über eine intuitive Benutzeroberfläche. Mittels KI-Tools lassen sich Skizzen in Designs umwandeln, Texte in Bilder integrieren und Objekte in Fotos austauschen. Ideal für Social Media, Marketing oder private Projekte. (https://www.canva.com/de_de/). Update 14.04.2025: Canva Sheets: Tabellen lassen sich einfacher visuell gestalten, per Drag & Drop anpassen und mithilfe von KI auswerten. Formeln können in Alltagssprache eingegeben werden. Magic Charts: Daten aus Tools wie Google Analytics können importiert und automatisch in interaktive Diagramme umgewandelt werden. Canva Code: User können interaktive Inhalte wie Tools, Spiele oder Quizze erstellen – allein durch eine textbasierte Beschreibung, ohne Programmierkenntnisse. Canva AI: Designs, Bilder und Funktionen lassen sich per Texteingabe durch ein leistungsfähiges KI-Modell erstellen. Neuer Fotoeditor: Hintergründe lassen sich per Klick austauschen, Objekte können direkt im Bild verschoben werden
Zusatzinfos: Kostenlose Testversion für einen Monat

Funktionen: Text-zu-Bild: Erzeuge Bilder aus Beschreibungen Text-Effekte: Worte mit visuellem Stil versehen Generative Füllung: Inhalte in Bildern intelligent ergänzen Integration in Adobe Creative Cloud (Photoshop, Illustrator, Premiere Pro) Fokus auf kommerzielle Nutzbarkeit: Firefly wurde mit lizenzierten Daten trainiert. Fazit: Express ist das praktische Design-Tool mit Vorlagen und einfacher Bedienung – ideal für schnelle Ergebnisse. Firefly ist die kreative KI-Maschine im Hintergrund – für komplexe, generative Inhalte. In Adobe Express kannst du Firefly nutzen, aber Firefly ist auch separat in Profi-Tools eingebunden.
Zusatzinfos:

Detaillierte Beschreibung der Funktionen 1. Text-to-Video (Gen-2) Du gibst eine Szene als Text ein, z. B. „Ein futuristischer Roboter läuft durch eine verlassene Stadt“. Runway generiert daraus ein kurzes Video mit realistischer Bewegung, Licht und Textur. Ideal für Storyboards, Filmideen oder visuelle Prototypen. 2. Bild-zu-Video Lade ein Bild hoch (z. B. ein Charakterdesign oder eine Landschaft). Die KI animiert das Bild, z. B. durch Kamerafahrten, Bewegungen oder Transformationen. Perfekt für Künstler, die statische Werke zum Leben erwecken möchten. 3. KI-gestütztes Video-Editing Tools wie Green Screen, Inpainting oder Motion Brush ermöglichen: Entfernen oder Ersetzen von Hintergründen ohne Greenscreen Selektives Bearbeiten einzelner Bildbereiche im Video Hinzufügen von Bewegung zu statischen Objekten Besonders hilfreich für Postproduktion, VFX oder Social-Media-Clips. 4. Bildgenerierung & Bearbeitung Erzeuge Bilder aus Text (ähnlich wie DALL·E oder Midjourney). Nutze Tools wie Erase & Replace, um gezielt Bildbereiche zu verändern. Kombiniere mit Stilvorgaben für konsistente visuelle Ästhetik. 5. Audio-Tools Transkribiere automatisch gesprochene Inhalte aus Videos. Erkenne und isoliere bestimmte Geräusche oder Stimmen. Nutze KI zur Generierung von Soundeffekten oder Musikuntermalung. 6. Workflows & Automatisierung Erstelle eigene Pipelines, z. B.: Text → Bild → Video → Schnitt → Export Integriere Runway in bestehende Tools via API oder Webhooks. Besonders nützlich für Teams mit wiederkehrenden Produktionsaufgaben.
Zusatzinfos: Kostenlos mit Account Gen-3 Alpha Turbo (Image to Video) up to 10 sec Gen-1 (Video to Video) up to 4 sec Gen-2 (Text and Image to Video) up to 16 sec via Extend Video. Kostenpflichtig ab 15 Dollar/Monat

Detaillierte Beschreibung der Funktionen 1. Text-to-Video Du gibst eine Beschreibung ein wie „Ein kleiner Mann verlässt eine Plastikverpackung“. Kaiber interpretiert den Prompt und generiert ein kurzes Video mit animierten Szenen. Ideal für kreative Ideen, Storyboards oder visuelle Experimente. 2. Bild-zu-Video Lade ein Bild hoch (z. B. ein Charakterdesign oder eine Landschaft). Die KI erzeugt eine Bewegung oder Transformation basierend auf dem Bildinhalt. Nützlich für Künstler, die ihre Werke animieren möchten. 3. Musikvisualisierung Du kannst ein Musikstück hochladen. Kaiber erstellt ein Video, das visuell auf die Musik abgestimmt ist – z. B. rhythmische Bewegungen, Farbwechsel oder abstrakte Formen. Besonders beliebt bei Musikern und DJs für YouTube oder Spotify Canvas. 4. Storytelling & Kurzfilme Kombiniere mehrere Szenen zu einer kohärenten Geschichte. Nutze die „Canvas“-Funktion, um Szenen zu planen, zu bearbeiten und zu verbinden. Perfekt für Kurzfilme, Trailer oder experimentelle Erzählformate. 5. Social Media Content Erstelle auffällige, kurze Clips mit hohem Wiedererkennungswert. Die Plattform bietet verschiedene Seitenverhältnisse (z. B. 9:16 für TikTok). Du kannst die Länge, Stil und Intensität der Animationen anpassen. 6. Branding & Marketing Entwickle visuelle Assets, die deine Marke repräsentieren. Nutze Kaiber für Produktvisualisierungen, Logoanimationen oder Kampagnenvideos. Besonders hilfreich für Startups und Agenturen mit begrenzten Ressourcen.
Zusatzinfos: Anmeldung über google konto

Detaillierte Beschreibung der Funktionen 1. Text-to-Video Du gibst eine Szene als Text ein, z. B. „Ein Verkehrsunfall an einer deutschen Kreuzung“. Pika erzeugt ein kurzes Video mit realistischer Darstellung, Lichtstimmung und Perspektive. Ideal für Storyboards, Kurzfilme oder visuelle Prototypen. 2. Bild-zu-Video Lade ein Bild hoch (z. B. eine Polizeibeamtin auf der Straße). Die KI animiert das Bild, z. B. durch Kamerabewegung, Mimik oder Umgebungseffekte. Nützlich für Künstler, die ihre Werke zum Leben erwecken möchten. 3. Video-Modifikation Du kannst bestehende Videos hochladen und verändern – z. B. durch neue Objekte, Perspektiven oder Stilwechsel. Besonders hilfreich für die Nachbearbeitung oder kreative Variationen. 4. Regionale Bearbeitung Mit „Modify region“ kannst du gezielt einzelne Bildbereiche verändern. Beispiel: Nur die Uniform einer Person wird angepasst, während der Rest des Bildes gleich bleibt. 5. Stil- und Effektanpassung Pika bietet kreative Werkzeuge wie: Pikaffects: Visuelle Effekte (z. B. dramatische Beleuchtung, Farbfilter) Pikaswaps: Objekt- oder Charakteraustausch Pikatwists: Unerwartete Variationen oder Stilbrüche 6. Szenenplanung & Storytelling Mit „Pikaframes“ und „Pikascenes“ kannst du mehrere Szenen zu einer Geschichte verbinden. Du planst Übergänge, Kamerawinkel und Erzählstruktur direkt in der Plattform.
Zusatzinfos:

Anwendung Beschreibung Audio-Sampling für Musik Nutze Filmsätze als kreative Samples für Musikproduktionen oder Sounddesign. YouTube-Videos & B-Rolls Finde passende Clips für deine Videos, z. B. als visuelle Ergänzung oder humorvolle Einleitung. Memes & Social Media Content Erstelle virale Inhalte, indem du bekannte Zitate mit aktuellen Trends kombinierst. Zitatsuche für Präsentationen oder Blogs Verwende prägnante Filmzitate zur Illustration von Aussagen oder zur Auflockerung. Sprachtraining & Ausspracheübungen Höre dir native Sprecher in realen Kontexten an – hilfreich für Sprachlernende. Zusatzinfo: Die Nutzung ist kostenlos und erfordert keine Anmeldung. Du gibst einfach einen Satz ein – z. B. „I’ll be back“ – und erhältst sofort passende Clips aus bekannten Filmen oder Serien.
Zusatzinfos: 3$/Monat
Link auf Playphrase.me Sprach-KI

Das Segment Anything Model (SAM) identifiziert automatisch Objekte in Bildern und verfolgt sie über alle Frames eines Videos. Dies ermöglicht eine präzise Segmentierung für Videobearbeitung, Mixed Reality und andere Anwendungen. (https://segment-anything.com/)
Zusatzinfos: Lokale Installation über Github möglich.
Link auf Segment Anything Meta

Midjourney erzeugt fotorealistische oder künstlerische Bilder durch beschreibende Texte. Über den Discord-Server können Nutzer Befehle eingeben und erhalten in kurzer Zeit hochqualitative Ergebnisse. (https://discord.com/login)
Zusatzinfos: /settings für Einstellungen, z.B. Version 6 oder Raw Style. Eintragungen nach dem Prompt: Leerzeichen, dann --ar 16:9 --style raw --v 6.0 Gleiche Bilder: Bilder erstellen. Neben dem Prompt auf die drei Punkte klicken. Reaktion hinzufügen und envelope in die Suche. Dann auf Mailkarte klicken und der Seed wird im Prompt angezeigt. Dann Prompt kopieren, in Eingabe einfügen und --seed mit dem kopierten seed hinzufügen. Oder auf V1-4 klicken und den Prompt ändern.
Link auf Midjourney Discord Server

PlayHT 2.0 ermöglicht das Klonen und Erstellen realistischer Stimmen anhand kurzer Sprachproben. Darüber hinaus können Nutzer Avatare erstellen, die in Videos oder Präsentationen eingebunden werden. (https://play.ht/conversational/)
Zusatzinfos:

- Emotionale Sprachsynthese Lachen, Überraschung, Freude, Traurigkeit – Sonic-3 kann echte Emotionen in der Stimme wiedergeben. Ideal für Konversationsagenten, die menschlich und empathisch wirken sollen. - Mehrsprachigkeit & Lokalisierung Unterstützt über 40 Sprachen, darunter auch 9 indische Sprachen wie Hindi. Native Stimmen sorgen für authentische Kommunikation weltweit. - Echtzeit-Reaktion Ultra-niedrige Latenz (<100 ms): Gespräche wirken flüssig und natürlich. Reaktionsgeschwindigkeit liegt unter der menschlichen Wahrnehmungsschwelle („Blink of an eye“). - Kontextverständnis & Intelligenz Erkennt und verarbeitet Abkürzungen und Initialismen korrekt (z. B. „NASA“ vs. „NSA“). Passt sich dem Gesprächsverlauf an und liefert kontextgerechte Antworten. - Voice Cloning Instant Cloning: Erstelle individuelle Stimmen in nur 10 Sekunden. Pro Voice Cloning: Feinabgestimmte, professionelle Klone für Unternehmen. - Entwicklerfreundlich & skalierbar API & SDKs: Einfache Integration in eigene Anwendungen. Playground: Teste Stimmen direkt im Browser. Enterprise-ready: SOC 2, HIPAA, PCI-konform – geeignet für sensible Branchen. - Branchenlösungen Healthcare: Patientenkommunikation verbessern. Customer Service, Sales, Recruiting, Gaming: Einsatz in vielfältigen Szenarien. Personalisierte Stimmen: Von Sidekick bis Experte – für jede Rolle die passende Stimme. - Performance & Zuverlässigkeit Führend bei Latenz weltweit (P50 bis P99). Hohe Verfügbarkeit und Skalierbarkeit für globale Anwendungen.
Zusatzinfos:

Einzelne Anwendungsmöglichkeiten: Visual AI Agents Erstelle digitale Gesprächspartner, die dein Unternehmen repräsentieren – inklusive Stimme, Aussehen und Wissen über deine Produkte. Video Studio Verwandle Fotos oder Videos in sprechende Avatare mit realistischer Mimik und Lippenbewegung. Video Translate Übersetze Videos automatisch in über 30 Sprachen – inklusive Lippen-Synchronisation und Untertitel. Video Campaigns Nutze personalisierte Videos für E-Mail-Marketing, Kundenbindung oder interne Kommunikation. API-Zugriff Integriere D-ID-Funktionen direkt in deine App oder Plattform – z. B. für Echtzeit-Streaming oder automatisierte Videoerstellung. PowerPoint & Canva Integration Erstelle KI-Videos direkt in bekannten Tools wie PowerPoint, Google Slides oder Canva. Voice Cloning & Audio Upload Nutze eigene Stimmen oder importiere Audio, um Avatare individuell sprechen zu lassen. Team Collaboration & Enterprise-Support Für größere Organisationen: Zusammenarbeit im Team, professionelle Übersetzungsdienste und höchste Sicherheitsstandards. Natural User Interface (NUI) Entwickle intuitive, gesichtsbasierte Interfaces – z. B. für KI-gestützte Beratung oder interaktive Lernplattformen.
Zusatzinfos:

IONOS GPT basiert auf dem IONOS AI Model Hub , der das Llama-Modell bereitstellt. • Text-Assistent: Klare, kreative und professionelle Inhalte für jeden Einsatzzweck. • Bild-Assistent: Einfache Generierung und Bearbeitung von professionellen Bildern, die sich sehen lassen können. • Code-Assistent: Alles rund um Programmierung und Automatisierung aus einer Hand. • Wissens-Assistent: Präzise Antworten, verlässlich recherchiert und verständlich erklärt für solide Business-Entscheidungen. Direkt starten: IONOS GPT braucht keine Einarbeitung, sondern ermöglicht die Interaktion mit der KI völlig intuitiv im Chat-Modus
Zusatzinfos: Nur nutzbar mit einem Account bei IONOS. Dann kostenlos.

AgentGPT ermöglicht das Konfigurieren und Ausführen autonomer KI-Agenten im Browser. Der Agent erstellt eigenständig Aufgaben, führt sie aus und bewertet die Ergebnisse, um ein zuvor definiertes Ziel zu erreichen. (https://agentgpt.reworkd.ai/de)
Zusatzinfos:

Google Bard ist eine KI-Anwendung, die Konversationen in natürlicher Sprache führt, Bilder interpretiert und kontextbezogene Antworten liefert. Als Teil von Google Labs wird Bard kontinuierlich verbessert und kann für Recherchen, Ideenfindungen und vieles mehr eingesetzt werden. (https://bard.google.com/)
Zusatzinfos:

Poe bietet eine Oberfläche, um mehrere KI-Sprachmodelle (z.B. Claude2, ChatGPT, Google-PaLM, Llama-2) zu testen und zu vergleichen. So können Nutzer verschiedene Modelle ausprobieren und ihre Stärken gezielt einsetzen. (https://poe.com/)
Zusatzinfos: mit Account kostenlos

Undetectable.AI transformiert KI-generierte Antworten so, dass sie von gängigen AI-Detection-Tools nicht mehr als KI-Text erkennbar sind. Dies ist besonders nützlich, um natürlich wirkende Texte zu veröffentlichen. (https://undetectable.ai/)
Zusatzinfos:

Olilo.ai bindet ChatGPT, Bard, Claude und Jurassic auf einer Plattform ein, sodass man die Antworten verschiedener KI-Systeme direkt nebeneinander vergleichen kann. Dies erleichtert es, das beste Modell für den eigenen Use Case zu finden. (https://olilo.ai/llms)
Zusatzinfos:

Mixtral bietet einen GPT-ähnlichen Chat ohne Registrierungszwang. Nutzer können beliebige Fragen stellen und kontextbezogene Antworten erhalten, ohne ein Konto anlegen zu müssen. (https://mixtral.replicate.dev/)
Zusatzinfos: Mistral als kostenlose Alternative zu ChatGPT. Bei DAten aus dem Internet nicht zuverlässig

Der ChatGPT Playground erlaubt das Experimentieren mit verschiedenen Prompt-Einstellungen und KI-Modellen. Entwickler können hier ChatGPT-APIs ansprechen, Scripting testen und die Antworten evaluieren. (https://platform.openai.com/playground)
Zusatzinfos: Developer Platform von OpenAI

Einzelne Möglichkeiten im Überblick: Enterprise Agents Erstelle KI-Agenten, die Aufgaben automatisiert ausführen, sich anpassen und mit deinen Apps und Datenquellen interagieren. AI-powered Search Integriere intelligente Suchfunktionen, die deine unternehmensspezifischen Daten durchforsten und präzise Antworten liefern. Deep Research Nutze KI für umfassende Recherchen und Zusammenfassungen aus komplexen Quellen – ideal für Analyse, Strategie und Wissensmanagement. Coding & Analysis Erhalte Unterstützung beim Programmieren in über 80 Sprachen – inklusive Code-Vervollständigung, Optimierung und Debugging. File Processing Verarbeite beliebige Dateien mit KI-gestützter OCR und Vision-Modellen – z. B. zur Texterkennung, Strukturierung oder Analyse. Builder APIs Entwickle eigene KI-Anwendungen mit Mistrals APIs – von einfachen Bots bis zu komplexen Agentensystemen. Bespoke AI Deployments Trainiere und deploye maßgeschneiderte Modelle mit deinen Daten – inklusive Fine-Tuning, Distillation und Integration in bestehende Systeme. Privacy-first Infrastructure Nutze Mistral lokal, in der Cloud oder am Edge – mit voller Kontrolle über deine Daten und Sicherheitsrichtlinien.
Zusatzinfos:

Einzelne Funktionen und Anwendungsmöglichkeiten Funktion Beschreibung Multimodell-Vergleich Stelle eine Frage und erhalte Antworten von verschiedenen LLMs wie GPT-4, Claude, Gemini, Mistral etc. Öffentliches Ranking Modelle werden basierend auf Nutzerbewertungen in einer Rangliste geführt – du kannst mitentscheiden. Feedback geben Bewerte jede Antwort direkt (z. B. hilfreich, ungenau, kreativ), um die Plattform zu verbessern. Antwortverlauf & Transparenz Du kannst vergangene Antworten einsehen und nachvollziehen, wie sich Modelle bei verschiedenen Fragen schlagen. Hinweis zur Datennutzung Eingaben und persönliche Informationen können öffentlich geteilt und an KI-Anbieter weitergegeben werden – daher keine sensiblen Daten eingeben
Zusatzinfos:
Link auf Chatbot Arena LMArena.ai

ROMO AI vereint verschiedene KI-Funktionen unter einer Oberfläche: Nutzer können Texte verfassen, Bilder erstellen, Code generieren oder Audiodateien analysieren. Auch SEO-Artikel und Dateiuploads werden unterstützt. (https://www.romoai.com/)
Zusatzinfos: Kostenlose Variante verfügbar, dann von 2,90-14.90 Dollar.

ChatPlayground integriert verschiedene Chatbots wie Claude3, GPT-4 oder MistralAI auf einer Oberfläche. Nutzer können die Ausgaben vergleichen und Zusatzfunktionen wie Dateiuploads oder Prompt-Verwaltung nutzen. (https://www.chatplayground.ai/)
Zusatzinfos:

Was du mit Claude.ai machen kannst: Texte schreiben und überarbeiten Erstelle Artikel, E-Mails, Zusammenfassungen oder kreative Inhalte – mit Fokus auf Klarheit und Stil. Code generieren und analysieren Unterstützt viele Programmiersprachen, erkennt Fehler, erklärt Code und hilft bei der Optimierung. Dateien hochladen und analysieren Lade PDFs, Bilder oder andere Dokumente hoch, um Inhalte zu extrahieren, zusammenzufassen oder zu interpretieren. Bilder verstehen Claude kann Bilder analysieren und beschreiben – z. B. für UI-Feedback, Diagramminterpretation oder OCR. Recherche und Websuche (Pro) In höheren Tarifen kann Claude auf aktuelle Webinhalte zugreifen und komplexe Recherchen durchführen. Projekte organisieren Chats lassen sich in Projekte gliedern – ideal für Teams, die gemeinsam an Inhalten oder Ideen arbeiten. Google Workspace Integration (Pro) Verknüpfe Claude mit Gmail, Google Kalender oder Docs für produktive Workflows. Erweiterte Denkprozesse (Claude Pro & Code Max) Nutze Claude für tiefere Analysen, strategische Planung oder technische Problemlösungen mit höherem Kontextverständnis. Hinweis: Claude ist in verschiedenen Tarifen verfügbar – von kostenlos bis hin zu Enterprise-Angeboten mit Prioritätszugang und erweiterten Funktionen.
Zusatzinfos:

Detaillierte Beschreibung der Funktionen 1. Mehrmodell-Zugriff Nutzer können zwischen verschiedenen LLMs wählen: ChatGPT (OpenAI) LLaMA (Meta) Mistral Qwen Dies ermöglicht einen direkten Vergleich der Antwortqualität, Stilistik und Fähigkeiten. 2. Textgenerierung Eingabe von Prompts zu beliebigen Themen (z. B. KI, Ethik, Technik, Bildung) Die Modelle generieren daraufhin Texte, Erklärungen, Zusammenfassungen oder kreative Inhalte. Ideal für Studierende, Lehrende und Forschende zur Ideenfindung oder Texterstellung. 3. Dokumenten-Upload Nutzer können eigene Dateien hochladen (z. B. PDFs, Texte). Die KI kann Inhalte analysieren, zusammenfassen oder Fragen dazu beantworten. Besonders hilfreich für Literaturauswertung, Prüfungsvorbereitung oder Projektarbeit. 4. Modellvergleich Durch parallele Nutzung mehrerer Modelle lassen sich Unterschiede in: Argumentationsstruktur Sprachstil Faktengenauigkeit Kreativität analysieren. Dies fördert ein tieferes Verständnis für die Funktionsweise von LLMs. 5. Zugangsbeschränkung Die Plattform ist ausschließlich für Hochschulangehörige zugänglich. Anmeldung erfolgt über einen KI-Campus-Account. Dies gewährleistet einen geschützten Raum für akademische Nutzung.
Zusatzinfos:

Einzelne Anwendungsmöglichkeiten: Chatbot-Funktion Stelle Fragen, führe Gespräche oder lasse dir Inhalte generieren – von Texten über Zusammenfassungen bis zu kreativen Ideen. Bildverarbeitung & Bildverständnis Lade Bilder hoch und erhalte Beschreibungen, Analysen oder visuelle Interpretationen – z. B. für UI-Feedback oder OCR. Bildgenerierung Erzeuge Bilder aus Textbeschreibungen mit KI – ideal für kreative Projekte, Illustrationen oder visuelle Prototypen. Videoverständnis (in Entwicklung) Analysiere Videoinhalte, extrahiere Szenen oder erhalte Zusammenfassungen – besonders spannend für Medienanalyse. Dokumentenverarbeitung Lade PDFs, Word-Dateien oder andere Dokumente hoch und lasse Inhalte extrahieren, zusammenfassen oder interpretieren. Websuche-Integration Kombiniere KI mit Live-Webdaten – z. B. für aktuelle Informationen, Quellenrecherche oder Faktenprüfung. Tool-Nutzung & Agentenfunktionen Qwen kann externe Tools nutzen, z. B. für Berechnungen, Code-Ausführung oder Datenanalyse – ähnlich wie ein KI-Agent. Softwareentwicklung & Codehilfe Schreibe, analysiere oder optimiere Code in verschiedenen Sprachen – inklusive Debugging und API-Integration. Deep Research & Wissensanalyse Führe komplexe Recherchen durch, vergleiche Quellen oder strukturiere große Informationsmengen. Reiseplanung & Organisation Nutze Qwen als Planungsassistent für Reisen, Events oder Projekte – inklusive Routen, Empfehlungen und Zeitplanung.
Zusatzinfos:

GPT4All ermöglicht das Ausführen von LLMs wie GPT-J oder LLaMA direkt auf dem eigenen Laptop oder PC, ohne Cloud-Anbindung. Nutzer können offline Fragen stellen, Texte generieren oder Dokumente analysieren. (https://www.nomic.ai/gpt4all)
Zusatzinfos:

Ollama erlaubt das lokale Ausführen großer Sprachmodelle unter macOS, Linux oder Windows (Vorschau). Mit einer integrierten Bibliothek an Modellen wie Llama 3.1 oder Mistral lassen sich Chat- und Codieraufgaben offline erledigen. (https://ollama.com/)
Zusatzinfos:

Msty erlaubt das Betreiben eines KI-Chatbots komplett offline und ohne komplexe Installation. Mit nur einem Klick können Nutzer den Chat starten, Daten lokal speichern und ihre Privatsphäre wahren. (https://msty.app/)
Zusatzinfos:

Möglichkeiten der Anwendung Browserbasierte Ausführung von LLMs Modelle laufen direkt im Browser, ohne externe Server. Das bedeutet: keine Datenübertragung, volle Kontrolle über die eigene Privatsphäre. Modellverwaltung (Manage Models) Nutzer können verschiedene Sprachmodelle herunterladen, laden und verwalten. So lässt sich flexibel zwischen unterschiedlichen Modellgrößen und -fähigkeiten wechseln. Neue Chats starten Es können beliebig viele neue Chat-Sitzungen begonnen werden. Jede Sitzung ist unabhängig und kann für unterschiedliche Themen genutzt werden. Projektverwaltung (Projects) Neben Chats lassen sich Projekte anlegen, die eine strukturierte Arbeit mit KI ermöglichen – etwa für längere Texte, Dokumentationen oder wiederkehrende Aufgaben. Einstellungen (Settings) Anpassung der Anwendung an die eigenen Bedürfnisse, z. B. Auswahl des Standardmodells, Interface-Optionen oder Speicherverwaltung. Offline-Nutzung Da die Modelle lokal geladen werden, funktioniert die Anwendung auch ohne Internetverbindung, sobald ein Modell heruntergeladen ist. Datenschutzfreundliche Architektur Keine Daten verlassen das Gerät. Dies ist besonders relevant für sensible Inhalte oder vertrauliche Dokumente.
Zusatzinfos:

Möglichkeiten der Anwendung In-Browser Inference Sprachmodelle laufen direkt im Browser, beschleunigt durch WebGPU. Keine externe Serververarbeitung nötig – ideal für Datenschutz und Unabhängigkeit. Volle OpenAI-API-Kompatibilität WebLLM kann wie die OpenAI-API genutzt werden, inklusive Funktionen wie JSON-Mode, Function Calling und Streaming. Damit lassen sich bestehende Anwendungen leicht anpassen. Umfangreiche Modellunterstützung Unterstützt viele bekannte Modelle wie Llama, Phi, Gemma, RedPajama, Mistral, Qwen und weitere. So ist die Plattform vielseitig für unterschiedliche KI-Aufgaben einsetzbar. Integration eigener Modelle (Custom Models) Eigene Modelle im MLC-Format können eingebunden werden. Dies erlaubt maßgeschneiderte Lösungen für spezifische Szenarien. Plug-and-Play Integration Einfache Einbindung in Projekte über NPM, Yarn oder CDN. Dank modularer Architektur lässt sich WebLLM schnell mit UI-Komponenten verbinden. Streaming & Echtzeit-Interaktionen Unterstützt Streaming-Ausgaben für Chatbots oder Assistenten, wodurch Antworten in Echtzeit generiert und angezeigt werden. Web Worker & Service Worker Support Berechnungen können in separate Threads ausgelagert werden. Das verbessert die Performance und sorgt für flüssige Benutzeroberflächen. Chrome Extension Support WebLLM kann in Browser-Erweiterungen integriert werden. Beispiele zeigen, wie einfache oder komplexe Extensions erstellt werden können.
Zusatzinfos: Erklärvideo unter https://www.youtube.com/watch?v=CYlGZP2SMXc

Microsoft Copilot bietet nicht nur Chat- und Textfunktionen, sondern kann auch Bilder generieren, Reisepläne erstellen, Rezepte vorschlagen und Fitnesspläne anpassen. Die KI kann den Schreibstil verändern und verschiedene Sprachen verarbeiten. (https://copilot.microsoft.com/)
Zusatzinfos: Anmeldung mit Microsoft Konto. Dann kostenlos. Pro-Version für 22 Euro/Monat verfügbar.

Writesonic (bzw. ChatSonic) bietet einen Chatbot ähnlich ChatGPT, aber mit Echtzeitdaten, integrierter Bildgenerierung und Sprachsuche. Die Anwendung erstellt Artikel, Produktbeschreibungen und weitere Texte in über 25 Sprachen. Mit einem Abo ab 13 USD/Monat stehen große Wortkontingente (z.B. 100.000 Wörter) zur Verfügung. (https://app.writesonic.com/)
Zusatzinfos: Get started with 10,000 free words

Zapier verbindet verschiedene Apps und Dienste, um automatisierte Workflows zu erstellen. Mit KI-Funktionen lassen sich Daten formatieren, Chatbots konfigurieren und Prozesse effizient gestalten. (https://zapier.com/ai)
Zusatzinfos: Account und frei. 29 Dollar/Monat

Einzelne Möglichkeiten im Überblick: UI/UX Design Erstelle pixelgenaue Benutzeroberflächen für Web, Mobile und Desktop – mit flexiblen Layouts und responsivem Verhalten. Prototyping Baue interaktive Prototypen mit Klickpfaden, Animationen und Übergängen – ideal für Usability-Tests und Präsentationen. Designsysteme & Komponenten Nutze wiederverwendbare Bausteine, Variablen und Bibliotheken, um konsistente Designs über Teams hinweg zu gewährleisten. Dev Mode Übergib Designs direkt an Entwickler mit Spezifikationen, CSS-Snippets und Assets – ohne zusätzliche Tools. FigJam (Whiteboard) Brainstorme, plane und visualisiere Ideen kollaborativ – z. B. mit Mindmaps, Post-its oder Flowcharts. Teamkollaboration in Echtzeit Mehrere Personen können gleichzeitig am gleichen Projekt arbeiten – inklusive Kommentarfunktion und Versionsverlauf. AI-gestützte Funktionen Nutze KI, um Inhalte zu generieren, Code vorzuschlagen oder Layouts automatisch zu optimieren (z. B. mit „Prompt to Code“). Templates & Vorlagen Starte mit fertigen Layouts für Websites, Apps, Präsentationen, Social-Media-Posts und mehr. Plugins & Integrationen Erweiterbare Plattform mit Hunderten von Plugins – z. B. für Barrierefreiheit, Übersetzungen, Icons, Animationen oder Datenvisualisierung. Figma Sites & Figma Make (Beta) Erstelle komplette Websites direkt in Figma – mit oder ohne Code, inklusive Hosting und Veröffentlichung.
Zusatzinfos:

Das Vercel AI SDK unterstützt React/Next.js, SvelteKit und Vue/Nuxt, um KI-gestützte Chat-UIs zu erstellen. Dank Streaming-APIs lassen sich reaktionsschnelle Anwendungen bauen, die auf Node.js, Serverless oder Edge-Laufzeiten laufen. (https://sdk.vercel.ai/docs)
Zusatzinfos: Vergleich mehrerer Chatbots möglich.

Detaillierte Beschreibung der Funktionen 1. Text-zu-Visualisierung Du kannst einfach Text eingeben, importieren oder einfügen. Napkin erkennt automatisch die Struktur und Bedeutung und generiert passende Visuals wie: Diagramme Mindmaps Flowcharts Datencharts Kein Prompt-Engineering nötig – du arbeitest direkt mit deinem Text. 2. Präsentationen Die generierten Visuals lassen sich als .ppt, .png, .pdf oder .svg exportieren. Du kannst Icons, Farben, Schriftarten und Layouts anpassen. Ideal für Business-Meetings, Schulungen oder Projektvorstellungen. 3. Blog & Social Media Nutze die Visuals zur Aufwertung von LinkedIn-Artikeln, Instagram-Posts oder Twitter-Threads. Die Designs sind responsiv und stilistisch anpassbar – von formell bis kreativ. 4. Dokumentation Erstelle leicht verständliche Dokumente mit integrierten Grafiken. Besonders hilfreich für technische Anleitungen, Schulungsunterlagen oder interne Kommunikation. 5. Teamarbeit & Kollaboration Funktionen wie Teamspace, Live-Editing und Kommentierung ermöglichen: Gemeinsames Arbeiten an Visuals in Echtzeit Feedback direkt im Text oder auf Grafiken Verwaltung von Teammitgliedern und Projekten
Zusatzinfos:

Einzelne Anwendungsmöglichkeiten: Multimodell-Chat Nutze GPT-4, Claude, Gemini u. a. parallel in einem Interface – ideal für Vergleich und tiefere Analysen. Webseiten-Chat Öffne Merlin als Sidebar auf jeder Website und interagiere direkt mit dem Inhalt: Zusammenfassen, Übersetzen, extrahieren. Datei-Chat & Vision-Funktionen Lade PDFs, Bilder oder Dokumente hoch und stelle gezielte Fragen – inklusive OCR und Bildanalyse. Video- und Artikel-Zusammenfassungen Erhalte Highlights aus YouTube-Videos oder Texten – mit bilingualen Untertiteln und kompakten Übersichten. Textgenerierung & Schreibhilfe Verfasse Tweets, Blogposts, E-Mails oder Werbetexte direkt im Browser – inklusive Stil- und Tonanpassung. Übersetzung & Lokalisierung Übersetze Inhalte in über 50 Sprachen, inklusive Bild- und Videoübersetzung mit Untertitel-Synchronisation. Prompt-Verwaltung Speichere und verwalte eigene Prompts für schnellen Zugriff – nutzbar überall online mit „/“-Befehl. AI Playground Teste verschiedene Modelle in einer zentralen Umgebung – ideal für kreative oder technische Experimente. Crafts & Code-Generierung Erstelle Code, Diagramme oder Apps direkt im Chat – mit Live-Vorschau und Exportfunktionen. Projekte & Custom Agents Baue eigene KI-Chatbots auf Basis deiner Daten, Dateien oder Links – inklusive zentraler Verwaltung. Browser-Integration & Shortcuts Starte Merlin mit Ctrl+M/Cmd+M aus jedem Tab – für sofortigen Zugriff auf alle Funktionen.
Zusatzinfos:

Bing Chat erweitert die Bing-Suchmaschine um eine Chatfunktion, die auf ChatGPT-Technologie basiert. Nutzer erhalten umfassende Antworten mit Quellenangaben und können Folgefragen stellen, um die Recherche zu vertiefen. Bilder oder Websites werden auf Wunsch ebenfalls analysiert. (https://www.bing.com/?cc=de)
Zusatzinfos:

Mubert erzeugt individuelle Musikstücke mithilfe fortschrittlicher KI-Algorithmen. Nutzer können in Echtzeit die Länge und das Genre bestimmen, um passgenaue Soundtracks für Videos, Apps oder persönliche Projekte zu erhalten. (https://mubert.com/)
Zusatzinfos:

Stable.AI bietet die Möglichkeit, Musik durch Texteingaben zu erstellen. Nutzer können Instrumente, Beats und Stilrichtungen vorgeben. Monatlich stehen 20 Tracks mit jeweils 45 Minuten zur Verfügung. (https://stableaudio.com/)
Zusatzinfos:

Suno.AI generiert bis zu 2-minütige Songs, einschließlich Gesangslinien, basierend auf kurzen Texteingaben. Das Tool bietet verschiedene Stile und kann auch als Kollaborationspartner für Musiker dienen. (https://www.suno.ai/)
Zusatzinfos:

Music FX nutzt KI, um anhand kurzer Texteingaben neue Songs zu generieren. Anwender können Stil, Tempo und Instrumentierung festlegen und die Musik anschließend als MP3 oder WAV herunterladen. (https://aitestkitchen.withgoogle.com/tools/music-fx)
Zusatzinfos:

VocalRemover.org separiert Stimme und Begleitmusik aus Audiodateien, um z.B. Karaoke-Versionen zu erzeugen oder Instrumentalspuren für Remixe zu verwenden. Die KI erkennt Gesangsspuren präzise und filtert sie heraus. (https://vocalremover.org/)
Zusatzinfos:

Magic Studio bietet verschiedene KI-basierte Tools wie Magic Switch, Magic Media und Magic Design, um Präsentationen, Bilder oder Videos automatisiert zu erstellen oder zu erweitern. Funktionen wie Magic Expand oder Magic Morph erlauben das Rekonstruieren und Bearbeiten von Bildbereichen. (https://www.canva.com/newsroom/news/magic-studio/)
Zusatzinfos:

Die Seite präsentiert Manus als ein Tool zur Erstellung von Inhalten und Anwendungen, mit Fokus auf Webseiten, Präsentationen und KI-native Projekte. Nutzer können Aufgaben verwalten, Inhalte teilen und dabei Guthaben verdienen. Es gibt einen kostenlosen Einstieg sowie eine Testphase für erweiterte Nutzung.
Zusatzinfos:

Murf.AI wandelt Texte in verschiedene Sprachen und Stimmen um und bietet umfangreiche Anpassungsmöglichkeiten. Das Tool unterstützt diverse Stimmlagen und Dialekte, wodurch sich Audioinhalte schnell und professionell erstellen lassen. (https://murf.ai/)
Zusatzinfos:

Rask klont Stimmen und generiert Videos in einer anderen Sprache mit passender Lippenbewegung. So können Creator ihre Inhalte mit derselben Stimme in mehreren Sprachen bereitstellen. (https://de.rask.ai/)
Zusatzinfos:

Description: This AI assistant, using Langchain and open-source LLMs, performs retrieval-augmented generation (RAG) from your PDF documents. The user interface explicitely shows multiple steps to help understand the RAG workflow. This chatbot takes past questions into account when generating answers (via conversational memory), and includes document references for clarity purposes. Notes: Updated space with more recent LLM models (Qwen 2.5, Llama 3.2, SmolLM2 series) Warning: This space uses the free CPU Basic hardware from Hugging Face. Some steps and LLM models used below (free inference endpoints) can take some time to generate a reply.
Zusatzinfos:

Seaweed ist das hochmoderne KI-Videogenerierungsmodell von ByteDance, das mit PixelDance zusammenarbeitet. Dieses leistungsstarke Tool erstellt hochwertige, realistische Videos in verschiedenen Stilen und bietet vielseitige kreative Möglichkeiten.
Zusatzinfos:
Link auf GoEnhance.ai/ Seaweed AI

InVideo AI wandelt beliebige Texte in ansprechende Videoclips um. Verschiedene Vorlagen, Stile und Layouts stehen zur Verfügung, um Werbe-, Erklär- oder Social-Media-Videos schnell zu erstellen. (https://invideo.io/ai/)
Zusatzinfos:

Moonvalley erlaubt es, Texte, Skripte oder Bilder per Discord zu Videos zu verarbeiten. Nutzer können Figuren animieren, Szenen erstellen und Stilrichtungen ändern, um kreative Filmprojekte zu realisieren. (https://moonvalley.ai/)
Zusatzinfos:

Xlabs bietet das Projekt Deforum X FLUX auf GitHub, mit dem sich KI-gestützte Videos erstellen und animieren lassen. Über das Notebook DEFORUM_FLUX.ipynb können Nutzer Szenen gestalten, Objekte einfügen und verschiedene Stile ausprobieren. (https://github.com/xlabs-ai/deforum-x-flux)
Zusatzinfos:

Auflistung von KI-spezifischen Informationsquellen: Kategorie quellen