Der Trend geht hin zu kostenlos
MidJourney: KI-Bilder kostenlos testen – aber nur 25 Mal
MidJourney, eine der bekanntesten Plattformen für KI-generierte Kunst, hat überraschend ihren kostenlosen Testzugang wieder freigegeben. Diese Nachricht dürfte bei vielen Kreativen und KI-Enthusiasten für Aufsehen sorgen, denn MidJourney war lange Zeit nur kostenpflichtig verfügbar. Die Plattform erlaubt es Nutzern nun, bis zu 25 Bilder kostenlos zu generieren, bevor eine Zahlung erforderlich wird. Das klingt verlockend, doch ein Blick hinter die Kulissen zeigt, dass diese Entscheidung vermutlich kein Zufall ist.
Am selben Tag, an dem MidJourney den kostenlosen Testzugang ankündigte, brachte auch Idiogram, ein aufstrebender Konkurrent, sein neues Modell Idiogram 2.0 auf den Markt – und das ebenfalls kostenlos (siehe zweite Meldung). In der schnelllebigen Welt der KI-Kunst könnte diese Neuerung ein Versuch von MidJourney sein, seine Position zu sichern und potenzielle Nutzer davon abzuhalten, zur Konkurrenz zu wechseln. Für kreative Köpfe, die schon immer einmal mit KI-Tools experimentieren wollten, ist dies jedoch eine ideale Gelegenheit, beide Plattformen auszuprobieren und zu vergleichen. Wer dabei bleibt, hängt wohl davon ab, welche Bildergebnisse überzeugen – und ob man nach den ersten 25 Bildern bereit ist, für mehr zu zahlen.
Idiogram 2.0: Der neue Star der KI-Kunstszene?
MidJourney hat es sofort gemerkt: Mit der Einführung von Idiogram 2.0 hat sich die Landschaft der KI-Kunst verändert. Idiogram, bislang eher im Schatten von Giganten wie MidJourney, hat mit seiner neuen Version ordentlich aufgeholt. Besonders bemerkenswert ist die Fähigkeit von Idiogram 2.0, Texte sehr gut in Bilder einzubetten – eine Funktion, die viele andere KI-Kunstplattformen nur unzureichend beherrschen. Für Künstler und Designer, die Text und Bild nahtlos kombinieren möchten, bietet diese Plattform einen besonderen Reiz.
Doch auch hier gibt es Grenzen: Nutzer erhalten täglich nur 10 Credits, die sie für bis zu 40 Bilder verwenden können. Dies könnte insbesondere für Profis, die auf eine hohe Produktionskapazität angewiesen sind, ein Hindernis darstellen. Dennoch bleibt Idiogram 2.0 eine interessante Option für alle, die mit Text-Bild-Kombinationen arbeiten und bereit sind, ihre Kreativität in diesen neuen Rahmen zu zwängen. Die Frage ist, ob diese Plattform wirklich das Zeug hat, sich gegen etablierte Namen wie MidJourney durchzusetzen oder ob sie in der breiten Masse der KI-Tools untergeht.
Politische Manipulation durch KI-Bilder: Ein gefährlicher Trend
Die Grenze zwischen Realität und Fiktion verschwimmt zusehends – und die Politik ist keine Ausnahme. In den letzten Wochen sorgten KI-generierte Bilder, die von Donald Trump und seinen Anhängern verbreitet wurden, für Aufregung. Diese Bilder, die auf Plattformen wie Truth Social und X kursierten, zeigten Szenen, die es nie gegeben hat: Taylor Swift, die Trump unterstützt, oder Kamala Harris vor einer Menge, die eine kommunistische Flagge schwenkt. Diese Bilder sind nicht nur irreführend, sondern auch ein alarmierendes Beispiel dafür, wie KI-Technologie manipulativ eingesetzt werden kann.
Die politische Instrumentalisierung von KI-Tools könnte weitreichende Konsequenzen haben. In einer Zeit, in der Desinformation ein wachsendes Problem darstellt, könnten solche Bilder das Vertrauen der Öffentlichkeit in die Medien und in politische Prozesse weiter untergraben. Es ist eine Entwicklung, die nicht nur die Politik, sondern auch die Gesellschaft als Ganzes betrifft. Wie lange wird es dauern, bis solche Praktiken nicht nur ethisch, sondern auch rechtlich hinterfragt werden? Und wie können wir uns als Gesellschaft vor der Manipulation durch täuschend echte KI-Bilder schützen?
KI gegen Mücken: Der Bazo Iris zeigt, wo es juckt
Ein neues KI-gestütztes Gerät namens Bazo Iris könnte das Leben für alle, die unter Mückenstichen leiden, erheblich erleichtern. Dieses kompakte Gerät, das weniger als ein Pfund wiegt, nutzt fortschrittliche Vision-Algorithmen, um Mücken zu erkennen, zu verfolgen und zu markieren. Sobald eine Mücke entdeckt wird, sendet der Bazo Iris ein Signal an das Smartphone des Nutzers und zeigt genau an, wo sich der unerwünschte Besucher aufhält.
Das Gerät arbeitet auch in völliger Dunkelheit und nutzt einen sicheren Laserpointer, um die Position der Mücke zu markieren, sodass der Nutzer gezielt reagieren kann. Obwohl es die Mücke nicht direkt eliminiert, ist dies ein vielversprechender erster Schritt in der Anwendung von KI-Technologie zur Bekämpfung eines der lästigsten Insekten. Für Menschen, die besonders anfällig für Mückenstiche sind, könnte dieses Tool eine erhebliche Erleichterung bringen. Die Frage bleibt, wann die Technologie weiterentwickelt wird, um die Mücken nicht nur zu markieren, sondern auch unschädlich zu machen.
LTX Studio: Motion Tracking für jedermann
LTX Studio, eine Plattform für KI-generierte Videos, hat sich der Öffentlichkeit geöffnet – und bringt eine ganze Reihe spannender Funktionen mit. Eine der bemerkenswertesten ist das Motion Tracking, bei dem Nutzer ihre eigenen Gesichtsausdrücke aufnehmen und diese auf animierte Charaktere übertragen können. Diese Technologie, die bisher nur professionellen Studios vorbehalten war, ist nun für jeden zugänglich und eröffnet neue kreative Möglichkeiten.
Neben dem Motion Tracking können Nutzer auch einfache Zeichnungen (Scribbles) verwenden, um eine Szene zu skizzieren, die die KI dann in ein vollständiges Video umwandelt. Diese Funktionen richten sich an alle, die ihre kreativen Ideen in Videos umsetzen möchten, ohne tiefe technische Kenntnisse zu haben. Doch wie bei jeder neuen Technologie bleibt abzuwarten, wie gut die breite Masse diese Tools annehmen wird und ob LTX Studio es schafft, sich gegen andere etablierte Plattformen zu behaupten. Fest steht: Die Demokratisierung der Videoproduktion schreitet voran, und jeder kann jetzt sein eigener Regisseur sein.
D-ID: Videotranslation mit Klonen und Lippensynchronisation
D-ID hat ein neues Tool vorgestellt, das Videos nicht nur übersetzt, sondern dabei auch die Stimme des Sprechers klont und die Lippenbewegungen synchronisiert. Diese Technologie, die bisher nur in Science-Fiction-Filmen vorstellbar schien, ist nun Realität und stellt eine echte Innovation im Bereich der KI-gestützten Videoproduktion dar. Damit wird es möglich, Videos in mehreren Sprachen zu veröffentlichen, ohne dass die Authentizität der Originalaufnahme verloren geht.
Für Unternehmen und Content-Ersteller, die international tätig sind, bietet dieses Tool enorme Vorteile. Sie können ihre Videos nun mühelos in verschiedenen Sprachen präsentieren, ohne auf die mühsame und oft ungenaue Methode der Untertitelung zurückgreifen zu müssen. Doch wie bei allen Technologien, die menschliche Merkmale imitieren, stellt sich die Frage nach der ethischen Verantwortung. Wird diese Technologie zur Förderung globaler Kommunikation genutzt, oder könnte sie auch missbraucht werden, um Inhalte zu manipulieren? Die Entwicklung bleibt spannend, und es wird interessant zu beobachten, wie die Gesellschaft auf diese neue Möglichkeit reagiert.
ElevenLabs Reader: Die Welt in deiner Stimme vorgelesen
Stell dir vor, du könntest jedes Buch, jeden Artikel oder jedes Dokument in deiner eigenen Stimme vorgelesen bekommen. ElevenLabs hat diese Idee mit der globalen Einführung ihrer Reader-App Wirklichkeit werden lassen. Die App nutzt fortschrittliche KI, um Texte in einer Vielzahl von Stimmen vorzulesen – einschließlich deiner eigenen. Damit wird das Lesen von langen Texten nicht nur komfortabler, sondern auch persönlicher.
Die Anwendungsmöglichkeiten sind vielfältig: Von der produktiven Nutzung im Berufsalltag, bei der Berichte oder E-Mails einfach vorgelesen werden, bis hin zur Freizeit, wo man sich Romane in der eigenen Stimme anhören kann. Doch diese Technologie wirft auch Fragen auf: Welche Auswirkungen hat es auf unsere Lesegewohnheiten, wenn wir Texte zunehmend nur noch hören? Und wie verändert es unser Verhältnis zu der Stimme, die wir täglich hören? ElevenLabs bietet zweifellos eine interessante neue Möglichkeit, mit Texten zu interagieren. Aber wie jede neue Technologie bringt auch sie Herausforderungen und neue Denkansätze mit sich.
Perplexity: Von der Suchmaschine zum Allround-Tool
Perplexity, eine immer beliebtere KI-gestützte Suchplattform, entwickelt sich rasant weiter. In dieser Woche hat die Plattform eine neue Funktion eingeführt, die es Nutzern ermöglicht, Code direkt innerhalb der Suchergebnisse auszuführen. Diese sogenannte Code-Interpreter-Funktion eröffnet besonders für technisch versierte Nutzer zahlreiche neue Möglichkeiten, indem sie komplexe Abfragen und Analysen direkt in der Suchleiste ermöglicht.
Empfohlen von LinkedIn
Doch damit nicht genug: Perplexity plant auch, Werbung in seine Plattform zu integrieren, ähnlich wie es Google seit Jahren tut. Diese Entscheidung dürfte bei den Nutzern gemischte Reaktionen hervorrufen. Während die neue Code-Interpreter-Funktion ein echter Gewinn für viele sein könnte, stellt sich die Frage, wie die Einführung von Werbung das Nutzererlebnis beeinflussen wird. Werden Nutzer die Werbeeinblendungen akzeptieren, oder wird Perplexity riskieren, seine treue Community zu verlieren? Es bleibt abzuwarten, wie sich diese Neuerungen auf die Zukunft der Plattform auswirken werden.
Anthropic im Visier: Autoren verklagen KI-Unternehmen
Anthropic, ein Unternehmen, das für seine fortschrittlichen KI-Modelle bekannt ist, sieht sich mit rechtlichen Problemen konfrontiert. Autoren haben Klage eingereicht, weil ihre Werke angeblich ohne Genehmigung in einem großen Datensatz namens "The Pile" verwendet wurden. Dieser Datensatz, der aus einer Vielzahl von Online-Quellen zusammengestellt wurde, dient als Trainingsgrundlage für viele KI-Modelle, darunter auch die von Anthropic.
Die Klage wirft ein Licht auf ein wachsendes Problem in der KI-Branche: den Umgang mit urheberrechtlich geschützten Inhalten. Während KI-Modelle auf riesige Datenmengen angewiesen sind, um ihre Fähigkeiten zu entwickeln, stellt sich die Frage, ob und wie die Rechte der ursprünglichen Urheber gewahrt bleiben können. Für Anthropic und andere KI-Unternehmen könnte dieser Rechtsstreit richtungsweisend sein und die Art und Weise, wie KI in Zukunft trainiert wird, grundlegend verändern. Es bleibt spannend zu sehen, wie sich dieser Fall entwickelt und welche Konsequenzen er für die gesamte Branche haben wird.
Microsoft Phi-3.5: Kleine KI mit großem Potenzial
Microsoft hat ein neues, kompaktes KI-Modell namens Phi-3.5 vorgestellt, das speziell für mobile Geräte optimiert ist. Trotz seiner geringen Größe zeigt das Modell in verschiedenen Benchmarks beeindruckende Leistungen und steht größeren Modellen in nichts nach. Diese Entwicklung könnte den Weg für eine neue Generation von KI-Anwendungen ebnen, die auch auf weniger leistungsstarken Geräten reibungslos laufen.
Mit Phi-3.5 zielt Microsoft darauf ab, die Lücke zwischen leistungsstarken, aber ressourcenintensiven KI-Modellen und den Anforderungen mobiler Geräte zu schließen. Das Modell könnte besonders in Bereichen wie mobilen Apps, IoT-Geräten und anderen Anwendungen, die auf Echtzeit-KI-Interaktionen angewiesen sind, eine Schlüsselrolle spielen. Die Einführung dieses Modells zeigt, wie sich die KI-Technologie weiterentwickelt und an die Bedürfnisse einer zunehmend mobilen und vernetzten Welt anpasst. Es bleibt abzuwarten, wie sich Phi-3.5 im Vergleich zu anderen aufstrebenden Modellen in der Praxis bewährt.
GPT-4 anpassen: OpenAI öffnet die Tür zur Feinanpassung
OpenAI bietet nun die Möglichkeit, das GPT-4-Modell individuell anzupassen. Diese sogenannte Feinanpassung erlaubt es Unternehmen und Entwicklern, die KI mit spezifischen Daten zu trainieren und sie auf ihre individuellen Bedürfnisse abzustimmen. Dies könnte insbesondere für Branchen, die sehr spezielle Anforderungen haben, ein echter Durchbruch sein.
Für viele Unternehmen dürfte diese Möglichkeit jedoch überdimensioniert sein. Oft reicht es aus, auf bestehende Modelle und deren umfangreiche Wissensbasis zurückzugreifen, ohne den komplexen und ressourcenintensiven Prozess der Feinanpassung durchlaufen zu müssen. Doch für diejenigen, die auf maßgeschneiderte KI-Lösungen angewiesen sind, bietet OpenAI nun eine flexible und leistungsstarke Option. Mit der täglichen Bereitstellung von 1 Million Trainingstokens bis zum 23. September wird diese Funktion für eine begrenzte Zeit auch kostenlos angeboten – ein Angebot, das sicherlich viele Interessenten anlocken wird.
Partnerschaft von OpenAI und Condé Nast: Ein cleverer Schachzug
OpenAI hat eine strategische Partnerschaft mit Condé Nast geschlossen, einem Medienriesen, der Marken wie Vogue, The New Yorker und GQ besitzt. Durch diese Zusammenarbeit wird OpenAI in der Lage sein, auf Inhalte dieser renommierten Marken zuzugreifen und sie in ChatGPT zu integrieren. Diese Partnerschaft könnte OpenAI nicht nur helfen, seine Dienste zu verbessern, sondern auch rechtliche Auseinandersetzungen zu vermeiden, indem sie direkt mit den Rechteinhabern zusammenarbeiten.
Diese Zusammenarbeit ist Teil einer breiteren Strategie von OpenAI, sich mit verschiedenen Medienunternehmen zu verbünden, um die Nutzung von urheberrechtlich geschützten Inhalten zu legitimieren. Während andere KI-Unternehmen mit rechtlichen Problemen konfrontiert sind, könnte OpenAI durch solche Partnerschaften einen geschickten Weg gefunden haben, diese zu umgehen und gleichzeitig den Nutzern hochwertige Inhalte zu bieten. Es bleibt spannend zu beobachten, wie sich diese Kooperation entwickelt und ob andere Unternehmen dem Beispiel von OpenAI folgen werden.
Kaliforniens KI-Gesetz: OpenAI geht in die Offensive
OpenAI hat sich entschieden, öffentlich gegen das kalifornische Senatsgesetz 1047 Stellung zu beziehen. Dieses Gesetz zielt darauf ab, KI-Unternehmen für den Missbrauch ihrer Modelle verantwortlich zu machen. Die Gesetzgebung hat in der Tech-Branche eine hitzige Debatte ausgelöst, da viele Unternehmen befürchten, dass sie Innovationen behindern könnte.
Das Gesetz verlangt, dass Unternehmen haften, wenn ihre KI-Modelle für schädliche Zwecke eingesetzt werden, was OpenAI und andere Branchenführer als problematisch ansehen. Sie argumentieren, dass es unmöglich sei, alle potenziellen Missbrauchsmöglichkeiten vorherzusehen und dass eine solche Gesetzgebung den Fortschritt in der KI-Forschung und -Entwicklung ernsthaft gefährden könnte. OpenAIs öffentlicher Widerstand gegen das Gesetz zeigt, wie tiefgreifend die Auswirkungen auf die gesamte Branche sein könnten. Die nächsten Monate könnten entscheidend dafür sein, wie die Zukunft der KI-Gesetzgebung in den USA aussieht.
Google-KI macht Gmail-Emails besser
Google hat in dieser Woche neue KI-gestützte Funktionen für Gmail eingeführt, die das Verfassen von E-Mails erleichtern sollen. Nutzer können jetzt auf Knopfdruck ihre Entwürfe polieren und in eine professionellere Form bringen lassen. Diese Funktion, die „Polish“ genannt wird, könnte insbesondere für vielbeschäftigte Fachleute ein echter Gewinn sein, die in kurzer Zeit überzeugende Nachrichten verfassen müssen.
Neben der Politur bietet Gmail nun auch die Möglichkeit, E-Mails zu verfeinern, indem spezifische Stile wie „formal“ oder „locker“ gewählt werden. Diese Tools sind ein weiterer Schritt in Googles Bemühungen, KI in alltägliche Anwendungen zu integrieren und den Nutzern dabei zu helfen, ihre Kommunikation effizienter zu gestalten. Während einige Nutzer diese neuen Funktionen als hilfreiche Ergänzung sehen werden, könnten andere sich fragen, ob sie dadurch zu abhängig von KI-Tools werden. Dennoch steht fest: Mit diesen Updates könnte Gmail seine Position als eine der meistgenutzten E-Mail-Plattformen weiter festigen.
Die besten KI-Apps: Welche Tools wirklich nützlich sind
Der Venture-Capital-Gigant Andreessen Horowitz (a16z) hat eine Liste der Top 100 generativen KI-Konsumenten-Apps veröffentlicht, die einen Einblick in die derzeit beliebtesten und innovativsten Tools bietet. An der Spitze der Web-Produkte steht ChatGPT, dicht gefolgt von Character AI und Perplexity. Diese Apps haben sich durch ihre Benutzerfreundlichkeit und ihren Funktionsumfang einen festen Platz bei den Nutzern gesichert.
Überraschenderweise findet sich Microsoft Edge auf Platz zwei der mobilen Apps – eine Platzierung, die viele erstaunt hat. Perplexity, ein bei vielen Nutzern beliebtes Tool, landet auf Platz 50 der mobilen Apps, was die Frage aufwirft, warum es nicht höher eingestuft wurde. Diese Liste ist nicht nur ein Barometer für die aktuelle Popularität von KI-Tools, sondern zeigt auch, welche Anwendungen das Potenzial haben, in Zukunft noch weiter zu wachsen. Für alle, die sich für generative KI interessieren, bietet diese Rangliste einen spannenden Überblick darüber, welche Apps derzeit den Ton angeben und welche man im Auge behalten sollte.
Yoga teacher & Occupational therapy student
2 MonateD-ID’s real-time video translation is an incredible innovation for global communication!