Von Ultrabooks, Rappern und Video-Kursen

veröffentlicht von am 3. Februar 2012 (0) Kommentare

Nachdem ich in dieser Woche bereits auf das bevorstehende MWC-Developer-Event “Intel, the Platform of Choice“ am 28. Februar in Barcelona hingewiesen habe, bei dem teilnehmende Entwickler eines von 10 Ultrabooks gewinnen können, sollten Sie auch erfahren, wie man die kleinen Kraftpakete im Business professionell einsetzt. Anregungen dazu gibt kein Geringerer als William James Adams Jr., besser bekannt unter seinem Künstlernamen „will.i.am“, amerikanischer Rapper und Hip-Hop-Produzent und vor allem Frontman der Band „The Black Eyed Peas“.

In einem wirklich schicken Video erläutert der Musiker, warum sein Ultrabook mehr ist als ein gewöhnliches Notebook, wie es beim Komponieren und Abmischen hilft und somit weltweit zu einem seiner wichtigsten Begleiter wurde.
Hier das Promo-Video dazu:



Und hier exklusive Einblicke von will.i.am im Studio:



Viel Spaß bei den Videos, nun aber zu einem ganz anderen Thema, das aber immerhin auch mit Videos zu tun hat:

MIT veröffentlicht Video-Kurse für Parallel-Programmierer

Einige US-Unis haben ihr Grundkursmaterial im Internet veröffentlicht, um die angehende Studis für Informatik zu begeistern. Nicht immer ganz taufrisch, aber zum Lernen, Nachschlagen und Reinschnuppern ist das sicher nicht nur für amerikanische Schulabgänger interessant, sondern auch für Ein- und Umsteiger aus Deutschland. Wenn man mal unterstellen will, dass der angehende Informatiker keine Berührungsängste mit englischsprachigen Texten hat.

Vorreiter ist das Massachusetts Institute of Technology (MIT). Die Uni hat den Multicore Programming Timer veröffentlicht. Dabei handelt es sich um einen Schritt-für-Schritt-Kurs für Parallel-Programmierer samt Ideen für Gruppenarbeiten. Und natürlich mit einem umfangreichen Praxisteil. Das Ganze als Video-Lektionen. Dabei handelt es sich um Mitschnitte aus Vorlesungen. Übrigens mit Untertiteln. Das ist praktisch, da der eine oder andere Dozent schneller spricht als er denkt. Wer mag, kann aber auch die kompletten Texte zusätzlich aus dem Transcript-Bereich kopieren. Alle Videos lassen sich zudem frei downloaden (MP4).

Eine große Anzahl weitere Videos und Podcasts zu Programmier-Themen finden Sie auf der Seite http://www.openculture.com/freeonlinecourses in der Rubrik “Computer Science & Artificial Intelligence”.

Kategorien : Mobile,Multicore Tags : , , , , ,

Brauchen Software-Programmierer (keine) Thread-Checker?

veröffentlicht von am 30. Januar 2012 (0) Kommentare

Die Woche beginnen wir mal mit überraschenden Ergebnissen einer aktuellen Dr. Dobb’s Studie. Unter dem Titel „The Parallel Programming Landscape – Multicore has gone mainstream“  hat der renommierte Developer-Service am Ende des vergangenen Jahres knapp 300 namhafte Unternehmen aus dem Bereich Software-Entwicklung zu Zielen und Tools im Bereich „Parallel-Programmierung“ befragt. Dabei wurde eine erstaunliche Lücke zwischen den Ansprüchen und den tatsächlichen Vorgehensweisen sichtbar. So setzen beispielsweise zwei Drittel der befragten Unternehmen überhaupt keine Tools zur Thread-Kontrolle ein. Gleichwohl gaben 56 Prozent der Interviewten an, dass Parallel-Programmierung wichtig sei, und 26 Prozent erachten Parallel-Programmierung gar als entscheidend („critical“).

Diese Werte kann ich nur so deuten, dass eine steigende Zahl an Programmierern das Thema „Parallel Programmierung“ nun auf der Agenda hat (erfreulich), um leistungsfähige und zeitgemäße Anwendungen für Unterhaltung, Business oder Forschung und Lehre zu schreiben (sehr erfreulich!) ohne zu wissen, welche Tools dabei tatsächlich wertvolle Dienste leisten (sehr ernüchternd).

Immerhin: 11 Prozent der Befragten kennen und nutzen den Intel Inspector XE, der unter den Thread-Checker-Tools damit den Spitzenplatz einnimmt gefolgt von Micro Focus Boundschecker (9%) und Helgrind (6%). Andere Tools wurden von 8 Prozent der Befragten genannten. Und ebenso viele gaben vor, nicht zu wissen, ob und welche Programme zum Einsatz kämen.

Fazit: Noch immer nutzt der Großteil der Parallel-Programmierer gar kein Hilfsmittel, sondern sucht Code-Fehler per Hand oder Log-Analyse. Unfassbar.

Ihr lieben Leute“, möchte man ihnen zurufen, „das erfordert nicht nur immenses Know-how, sondern kostet Zeit und ist fehleranfällig. Verschwendet doch nicht die Zeit eurer besten Programmierer mit Aufgaben, die professionelle Tools schneller, effizienter und gewissenhafter erledigen. Lasst eure Developer wieder kreativ sein, und übergebt die Routine-Aufgaben den Programmier-Anwendungen. Ein Marco Reus soll in Gladbach auch nicht die Vitrinen putzen, sondern Tore für den nächsten Titel schießen (und vorbereiten natürlich).

Weitere Ergebnisse. 30 Prozent der Befragten nutzen Visual Studio 2010. Das Tool ist damit Marktführer. Die meist genannten Antworten auf die Frage „Warum optimieren Sie Ihren Code für Mehrkern-Systeme?“ lauten sinngemäß „Um die Performance der Programme zu verbessern“ und „Besserer Stellenwert beim Kunden/Käufer“.

Aufgrund dieser Ergebnisse beschleicht mich irgendwie das Gefühl, dass wir im vergangen Jahr nicht ausreichend die Werbetrommel für Intel Parallel Studio XE gerührt oder aber die falschen Leute adressiert haben. IT-Entscheider wüssten ansonsten, dass sie mit diesem Paket sowohl erstklassige Compiler erhalten als auch eine Reihe wirklich effizienter Analyse-Tools, die beim Coden einiges an Arbeit sparen – vor allem bei der Suche nach Fehlern oder Optimierungspotenzial. Nun denn…

Zum Wochenstart noch ein wirklich klasse Video (das rein gar nichts mit der zuvor zitierten Umfrage zu tun hat)

Im August und September des letzten Jahres war Intel unter dem Motto „3D Erlebnis“ in Deutschland unterwegs. Für diejenigen, die leider nicht dabei sein konnten (wie ich), hat Intel im Video einige Eindrücke zusammengestellt. Und ich verspreche euch: Lohnt sich! Viel Spaß!

Kategorien : Multicore,Visual Computing Tags : , , , , , ,

Großes Kino: Intel Software TV neu gestaltet!

veröffentlicht von am 22. November 2011 (0) Kommentare

Wir bringen Sie zum Film! Denn Intel hat sein Video-Portal für Developer, Intel Software TV, für Sie erneuert. Freuen Sie sich über ein neues Web-Design, eine große Zahl an HD-Videos und einen cleveren Player, der die Clips automatisch passend skaliert – sowohl für kleine Smartphones-Displays als auch Fernsehschirmgroße Monitore.

Und Sie finden genau die Videos, die Sie interessieren, ab sofort schneller anhand übersichtlicher Themengebiete Von besonderer Bedeutung ist dabei sicherlich die Kategorie „Parallel Programming“. Diese Reihe ist brandaktuell: Beispielsweise finden Sie reihenweise Clips von der SC11, der „International Conference for High Performance Computing, Networking, Storage and Analysis“, die vom 12.11 – 18.11.2011 in Seattle stattfand. Auf dieser Konferenz erläuterten Intel-Experten im Interview beispielsweise, welche Chancen der Cloud-Hype Parallel-Programmierern eröffnet, wie sich Vektorberechnungen schneller ausführen lassen und wie Intel-Hardware sogar das Wetter beeinflusst (na ja, fast jedenfalls).

Intel Software TV

Intel Software TV

Neugierig geworden? Hier geht es zur Übersicht.

Download-Option bei Intel Software TVÜbrigens: Wenn Sie die mitunter sehr ausführlichen Videos lieber offline als online ansehen: Kein Problem: Wir haben eine Download-Option für Sie. Sie können jeden Clip als MP4-File auf der Festplatte speichern.

Kategorien : Multicore,Visual Computing Tags : , ,

Zwei kostenlose Webinare: So verbessere ich die Performance meiner Applikationen

veröffentlicht von am 18. November 2011 (0) Kommentare

Über das Optimierungstool Intel VTune Amplifier XE habe ich ja schon das ein oder andere Mal berichtet. Dazu passt ganz gut ein Eintrag auf software.intel.com, der auf eine zweiteilige Webinar-Reihe aufmerksam macht, die Intel interessierten Entwickler kostenlos zur Verfügung stellt. Hierzu müssen Sie sich einmal registrieren, um anschließend beide Online-Trainings in voller Länge konsumieren zu können.

Teil 1 der virtuellen Kurse beschäftigt sich vor allem mit der Frage, wie sich Anwendungen, die auf den aktuellen Prozessoren von Intel (Stichwort: Sandy Bridge) laufen, so optimiert werden können, damit sie noch besser und performanter auf dem Rechner ausgeführt werden. Hierzu bietet VTune Amplifier XE eine eigene Funktion, mit der sich die Anwendung analysieren und auf Hotspots und ähnliche Bremsklötze untersuchen lässt.

Teil 2 der Webinar-Reihe zeigt, welche Hemmschuhe in einer Anwendung vorkommen können und wie sie mit Hilfe von Sandy-Bridge-Funktionen wie AVX behoben werden können. Natürlich lernen Sie auch, wie sich diese Funktionen optimal einsetzen lassen und weiter optimiert werden können.

Und wem das noch nicht genügt, dem möchte ich die zwei Videos ans Herz legen, die sich mit dem Thema Performance-Analyse ausführlich beschäftigen. Für das Abspielen der Videoclips müssen Sie sich übrigens nicht anmelden.

Alle Infos und den Anmeldelink finden Sie auf der zugehörigen Webseite auf dem Intel Software Network.

Kategorien : Multicore Tags : , , ,

[Videochat] Manuel Wille von Nik Software zu Multicore-Optimierungen, AVX und Parallel Studio XE

veröffentlicht von am 20. April 2011 (0) Kommentare

Hoch droben über den Dächern von Dubrovnik bekam ich ihn vor die HD-Kamera, inklusive Wind und Meerrauschen: Manuel Wille, seines Zeichen Vice President Engineering bei der Nik Software GmbH.

Manuel spricht in unserem Interview über die Optimierungen, die Nik Software an HDR Efex Pro vorgenommen hat. Die Rede ist aber auch von den Leistungssteigerungen, die das Lübecker Unternehmen dank des Einsatzes von AVX-Operationen erzielen konnte. Manuel spricht dabei von 30 bis 40 Prozent.

Und zu guter Letzt geht es noch um die Frage, welche Intel-Tools Nik Software zur Multicore-Optimierung seiner Anwendungen einsetzt. Die zugehörige Antwort fand ich dann doch einigermaßen überraschend. Doch seht am besten selbst…

Kategorien : Multicore Tags : , , ,

[Videochat] James Reinders von Intel über Entwicklertools, 2012 und MeeGo

veröffentlicht von am 19. April 2011 (0) Kommentare

Auf der diesjährigen Intel Software Conference im wundervollen Dubrovnik hatte ich die Gelegenheit, mit Chief Evangelist James Reinders von Intel ein paar Worte zu wechseln. Dabei ging es um vier schlichte Fragen, die er allesamt recht ausführlich beantwortet hat.

Zusammengefasst kann man sagen, dass Entwickler ein oder zwei Augen auf die neuen Intel Array Building Blocks werfen sollten, mit deren Hilfe mathematische Operationen in Zukunft recht einfach auf mehreren Prozessorkernen parallel ausgeführt werden können. Darüber hinaus nahm er sich sogar die Zeit, das Konzept hinter den verwandten Intel Threading Building Blocks zu erläutern.

Darüber hinaus verfolgt Intel mit MIC eine interessante Strategie: dieser Quasi-Nachfolger von Larrabee wird wohl im nächsten Jahr auf den Markt kommen und von sämtlichen Tools unterstützt werden, die es jetzt auch schon gibt. Nur in angepasster und verbesserter Form, natürlich.

Aber auch zu MeeGo und den passenden Entwicklertools hatte James eine dedizierte Meinung, wie sich anhand der Beispiele für künftige MeeGo-Gerätschaften erkennen lässt: so nennt er Tablet-PCs an Nummer Eins, aber auch Handhelds, In-Car-Infotainment- und andere Gadgets werden in Zukunft mit MeeGo laufen. Sagt zumindest Chefentwickler James Reinders.

Kategorien : Multicore,Visual Computing Tags : , , ,

OOP 2011: Stephen Blair-Chappell über die Parallelisierung von Anwendungen

veröffentlicht von am 27. Januar 2011 (0) Kommentare

Während der OOP 2011 in München hatte ich die Gelegenheit mit Stephen Blair-Chappell zu sprechen, der auf der Entwicklerkonferenz am zweiten Tag seinen Vortrag hielt. Die Präsentation lief unter dem Titel “Introducing parallelism into legacy code: Three case studies”. Kurz danach stand uns Stephen für drei kurze Fragen parat:

In welche Fallen tappen Software-Entwickler gemeinhin, wenn sie versuchen, seriell programmierte Anwendungen zu parallelisieren?

Gibt es Fälle, in denen es keinen Sinn macht, Teile einer Software-Anwendung zu parallelisieren?

Existieren gute Beispiele für erfolgreiche und erfolglose Versuche, bestehenden Code zu parallelisieren?

Na, dann viel Spaß mit dem Videointerview!

Kategorien : Multicore Tags : , , ,

OOP 2011 – Ralph de Wargny zu Multicore, Manycore, Intel Parallel Studio und mehr

veröffentlicht von am 26. Januar 2011 (0) Kommentare

Während der OOP 2011 in München hatte ich die Gelegenheit, mit Ralph de Warny von Intel dieses Videointerview zu führen. Ralph erzählte mir ein wenig über seinen Vortrag, den er auf der OOP gehalten hat, über die Themen Multicore und Manycore und die Tools Parallel Studio und Parallel Studio XE. Außerdem gewährte er eine kurzen Einblick in die Zukunft der Parallelprozessoren.

Kategorien : Multicore Tags : , , ,

Angry Byrds auf der CES und großes Kino für Sandy Bridge

veröffentlicht von am 10. Januar 2011 (0) Kommentare

Die CES in Las Vegas hat gestern ihre Tore geschlossen. Gelegenheit für mich, heute und in den nächsten Tagen einen Blick auf die Highlights zu werfen.

Über die Veröffentlichung von Sandy Bridge alias 2nd generation Intel Core processor family und Microsofts ehrgeizige Pläne habe ich ja bereits berichtet. Nicht aber über die heimlichen Stars der Messe. Das waren nämlich die „Angry Birds“. Am Intel-Stand konnte man sich die neue Version des Gaming-Stars ansehen und lustige T-Shirts mit den „fiesen Vögeln“ schenken lassen. Hintergrund: Das beliebte Spiel gibt es jetzt auch für Windows-Netbooks. Das Game kann ab sofort für rund 5 US-Dollar (nach der Promo-Aktion: 10 US-Dollar) aus dem Intel AppUp Center geladen werden. Bereits in den ersten beiden Tagen gab es über 3000 Downloads!

Wer das Game mit echtem Suchtfaktor noch nicht kennt, möge sich das Promo-Video anschauen:

Bleiben wir beim Thema Unterhaltung: Dass die Film- und Unterhaltungsindustrie sehr großes Interesse an den Sandy Bridge-Prozessoren hat, ist nicht neu. Nun ein paar Fakten zu einem Key-Feature der neuen Prozessor-Generation: Intel Insider. Mit dieser Technologie kann der Anwender Videos und Filme in HD abspielen – in einer bisher nie erreichten Qualität. Und das nicht nur auf dem Monitor. Denn mit dem im Chipsatz ebenfalls integrierten WiDi 2.0 lassen sich die Streifen auf große Bildschirme wie LCD-Fernseher streamen – in Echtzeit, versteht sich.

Hinzu kommt, dass Sandy Bridge mit einem eingebetteten Digital Rights Management den Kopierschutz kommerzieller Filme wahrt. Kein Wunder, dass Kevin Tsujihara von Warner Home Entertainment während der CES von dieser Perspektive begeistert war. Sinngemäß sagte er: „Warner Bros sieht in dem PC ohnehin die beste und beliebteste Plattform für digitales Entertainment. Jetzt, da Intel die Möglichkeiten verbessert und sicherer gemacht hat, werden wir in der Lage sein, neue Filme in HD-Qualität über unsere Online-Kanäle anzubieten und zwar am gleichen Tag, an dem diese auch für DVD und Blue Ray verfügbar sind“.

Kategorien : Multicore Tags : , , , ,

Das war die GDCE 2010: Videointerviews und mehr, Teil 3

veröffentlicht von am 27. August 2010 (0) Kommentare

Sodala, nachdem Teil 1 und Teil 2 der GDCE-2010-Rückschau draußen sind, folgt jetzt das dritte und letzte Kapitel meiner Trilogie in Sachen Spieleentwicklung. Den Abschluss soll ein Dreiteiler bilden (sic!), der sich mit der Analysetool-Suite Intel Graphics Performance Analyzers beschäftigt.

Den Anfang macht der System Analyzer, mit dem sich in Echtzeit analysieren lässt, was während des Gameplays alles passiert. Um das Testsystem von rechenintensiven Aufgaben zu befreien, läuft der System Analyzer auf einem anderen Rechner als das zu testende Spiel. Dabei stehen verschiedene Funktionen wie die CPU-Diagnose, das Ermitteln der Anzahl der Locks per Frame und der Framerate selbst sowie andere wichtige Parameter zur Verfügungung.

Praktisch am System Analyzer sind die vorhandenen Hardware-Diagnose-Tools, mit denen sich auf Intel-Systemen Dinge wie die Auslastung der vorhandenen Execution Units untersuchen lassen. Aber auch bestimmte Ansichten auf die aktuelle Spielszene erlauben das Analysieren des Spiels. So lassen sich beispielsweise mit der Gitterdarstellung verborgene Objekte entdecken, die dort gar nicht hingehören und nur überflüssige Rechenzeit verbraten.

Der Frame Analyzer geht dann richtig in die Tiefe und lässt jedes einzelne Bild eines Spiels analysieren. So kann man anhand der DirectX-Drawcalls feststellen, welche Bereiche eines Frames besonders viel Rechenzeit beanspruchen und diese Bereiche gegebenenfalls optimieren. So zeigen beispielsweise versteckte Objekte hohes Optimierungspotenzial, da sie zum Gameplay nichts beitragen, aber trotzdem Rechenzeit kosten. Um die möglichen “Störenfriede” zu eliminieren, kann man aber auch experimentell vorgehen, indem man einzelne Parameter ausschaltet um zu sehen, wie sich das auf die Szene und die Renderleistung auswirkt.

Das dritte Tool schließlich, Platform View, ist zum einen “neu” in der Version 3.0 von Intel GPA und bietet zum anderen einen detaillierten Blick auf den Parallelisierungsgrad des Spiels. Dabei kann man sich sämtliche Threads anzeigen lassen, die gerade aktiv sind und diese in der Detailansicht genau analysieren. So lässt sich beispielsweise herausfinden, warum die CPU auf die GPU warten muss oder auch anders herum.

Kategorien : Visual Computing Tags : , , , ,

Das war die GDCE 2010: Videointerviews und mehr, Teil 2

veröffentlicht von am 27. August 2010 (0) Kommentare

Wie ich gestern versprochen habe, folgt heute der zweite Teil des großen GDCE-2010-Rückblicks. Waren gestern die Havok Physics Engine, das Multithreaden von Games mithilfe von DirectX 11, Netbook-Games und Intel GPA dran, folgen heute Erkenntnisse rund um die nächste Version von Intel GPA, um das Parallelisieren von Spielen mithilfe von Intel TBB und einer Task-Stealing Engine der Marke Eigenbau.

Zum Thema “Nächste GPA-Version” konnte wir den dafür zuständigen Intel-Mann Aaron Davies überreden, vor der Kamera ein wenig in seine Glaskugel zu blicken. So verriet er uns, dass die nächste Version Anfang kommenden Jahres zur GDC 2011 in San Francisco vorgestellt wird. Dass Intel GPA 4.0 für die nächste Prozessorgeneration Sandy Bridge optimiert sein wird, überrascht genauso wenig wie die Tatsache, dass das Analysetool die noch in der Beta-Phase befindliche Platform View integrieren wird, da es sehr postives Feedback seitens der Entwickler gab. Die gute Nachricht: Intel GPA und andere Tools von Intel bleiben kostenlos für Entwickler, da der Chiphersteller seine große Fangemeinde weiterhin mit dieser Art der Dienstleistung beglücken will.

Von der Zukunft zurück in die Gegenwart ging es dann mit Mario Deilmann, der es sich zum Ziel gesetzt hatte, die anwesende Entwicklerschar während seiner Techsession davon zu überzeugen, dass mit Intel TBB ein Tool zur Verfügung steht, mit der sich Spieletitel an vielen Stellen parallelisieren lassen. Wie er anschließend vor unserer Kamera verriet, lieben Spieleentwickler Open-Source-Tools wie Intel TBB, da sie die gesamte Kontrolle über den Sourcecode des Tools haben. Auf der anderen Seite gibt es natürlich eine kommerzielle Version von Intel TBB für diejenigen, die auf Support nicht verzichten wollen.

Gut an Intel TBB ist aus Marios Sicht vor allem, dass sich der zu parallelisierende Code nicht mehr als Low-Level-Threads, sondern als abstrahierte Tasks darstellen lässt, was die Parallelisierung von Spielen erheblich vereinfacht. Aber auch die verschiedenen Abstraktionsebenen machen aus Intel TBB ein echtes Gaming-Dev-Tool. So kann man mit Konstrukten wie Concurrent Container und Concurrent Allocator genauso arbeiten wie mit Low-Level-APIs wie dem TBB Scheduler, um damit die besten Ergebnisse zu erzielen. Einen weiteren Pluspunkt sieht Mario in der Plattformunabhängigkeit von Intel TBB, das von Windows, Mac OS und anderen Betriebssystemen und Plattformen unterstützt wird.

Last but not least hatten wir gegen Ende der GDCE 2010 die Gelegenheit mit Dierk Ohlerich zu reden. Dierk ist Head of Technology bei 49Games aus Hamburg, die sich vor allem auf Konsolentitel aus dem Bereich Sportsimulationen konzentrieren. In seinem Videointerview erzählt er uns, dass er seine eigene Task-Stealing Engine geschrieben hat, mit deren Hilfe Spiele optimal auf unterschiedlichen Multicore-Systemen skalieren.

Das Hauptziel seines Projekts ist die Integration einer solchen Task-Stealing Engine in die Rendering Pipeline. Dabei galt es jedoch diverse Klippen zu umschiffen wie das genaue Vorhersagen des Datenaufkommens, wofür dynamische Datenspeicher notwenig sind. Aber auch die richtige Reihenfolge beim “Zeichnen” einer Spielszene stellt laut Dierk ein echte Herausforderung dar, wenn es um das Parallelisieren der Render Engine geht.

Kategorien : Visual Computing Tags : , , ,

Das war die GDCE 2010: Videointerviews und mehr, Teil 1

veröffentlicht von am 26. August 2010 (0) Kommentare

Letzte Woche war ich ja auf der Game Developers Conference Europe, und daher ist es jetzt an der Zeit, eine große Rückschau zu halten. Das geschieht in drei Teilen, damit ihr euch das Ganze Stück für Stück einverleiben könnt. Viel Spaß beim Angucken der Videos, die wir an den drei Tagen in Köln gedreht, geschnitten und online gestellt haben.

Am ersten Tag ging es gleich mal sehr animationsmäßig los und wir hatten die Gelegenheit, uns die Havok Physics Engine näher anzusehen, mit deren Hilfe Spieleentwickler recht einfach und schnell bestimmte Effekte in ihre Games einbauen können. Dazu gehören Dinge wie Deformationen, berstende Gegenstände, etc. Und auch vollanimierte Kleidungsstücke lassen sich mit Havok generieren, ohne dass der Entwickler genau wissen muss, wie das funktioniert. Dass es funktioniert, belegen die zugehörigen Videos sehr gut.

Das Thema Spiele beschäftige uns natürlich weiterhin (sic!). So konnten wir mit Jerome Muffat-Meridol von Intel über seine Techsession reden, in der es um das Thema Multithreading von 3D-Spielen mithilfe von DirectX 11 ging. Dabei zeigte er anhand der so gennanten Nulstein-Demo, dass sich Spiele sehr gut parallelisieren lassen, wenn man den richtigen Taskscheduler und DirectX 11 für die einzelnen Phasen beim Erzeugen von 3D-Bildern dazu einsetzt, das ganze System so gut wie möglich zu parallelisieren. Und das skaliert dann problemlos auf 12 Threads, ohne dass der Entwickler große Dinge vollführen muss.

Weiter ging’s dann mit einem ganz anderen Thema, das auf dem IT-techBlog sehr viel besser aufgehoben wäre: Netbook-Games. Hierzu zerrten wir Leigh Davies vor die Kamera, um ihm drei schlaue Fragen zu stellen. Dabei kam heraus, dass Leigh in seiner Session etwas darüber verraten hatte, wie sich Spiele für Netbooks verkaufen lassen und wie man Netbook-Games für die GPU und CPU optimieren kann.

Natürlich durfe auch der Hinweis nicht fehlen, dass sich Netbooks weiterhin gut verkaufen und dass Intel bis zum Jahr 2013 mit zirka 140 Millionen verkauften Mininotebooks rechnet. Es ging außerdem auch um technische Aspekte wie die eingeschränkte Auflösung (1024*600) und die daraus resultierenden Konsequenzen. So rät Leigh zum Einsatz von Icons statt Text. Darüber hinaus sollte man sich als Spieleentwickler klar machen, dass ein Netbook wegen der guten bis sehr guten Akkulaufzeiten und des geringen Gewichts in höchstem Maße mobil ist. Auch das gilt es beim Gamedesign zu berücksichtigen.

Aber nicht nur Spiele für tragbare Computer standen bei Intel auf de GDCE 2010 auf dem Programm. Auch die neuesten Version des Analysetools Intel Graphics Performance Analyzers wurde vorstellt, und hierum kümmerte sich Steve Hughes von Intel, der uns ein bisschen was über die neuen Features von Intel GPA 3.0 erzählte, wie man damit Flaschenhälse und andere Verklemmungen in 3D-Spielen findet und wie Entwickler die Toolsuite optimal für ihre Zwecke einsetzen können. Besonders begeistert zeigte er sich von der neuen Platform View, die systemübergreifend zeigt, wie gut ein Spiel auf einer Multicore-Maschine skaliert.

So, das war`s erstmal, Teil 2 und Teil 3 folgen morgen. Darin wird es um die nächste Version von Intel GPA gehen, um das Parallelisieren von Spielen mithilfe der Intel TBB, um einen selbstgezimmerten Taskscheduler mit Taskstealing und um eine Live-Demo, die anhand von drei Teilen genau zeigt, wie sich Intel GPA einsetzen lässt.

Kategorien : Visual Computing Tags : , , ,

Video: So lassen sich Spiele mit Intel GPA optimieren

veröffentlicht von am 23. Juli 2010 (0) Kommentare

Zugegeben, die Develop 2010 ist mittlerweile über eine Woche alt, und doch tauchen immer wieder nützliche Infos rund um das Thema Spieleprogrammierung auf. So auch heute auf dem SoftTalk Blog, auf dem ich ein interessantes und informatives Video gefunden habe. In diesem Fast-Fünfminüter spricht Leigh Davies neben seinem Job bei Intel vor allem über die Toolsuite Intel Graphics Performance Analyzers und wie sich damit PC-Spiele verbessern und optimieren lassen. So lernt man anhand des Videos folgende Dinge:

  • Intel GPA steht derzeit in der dritten Version kostenlos zum Download bereit, was lediglich mit einer kurzen Registrierung verbunden ist.
  • Mit Intel GPA lassen sich DirectX-Spiele untersuchen (DirectX 9 und 10), aber auch das PC-System kann zur Spiele-Laufzeit untersucht werden. Damit lassen sich beispielsweise CPU-Lasten ermitteln und wie das Spiel auf Basis der vorhandenen Ressourcen skaliert.
  • Mit Intel GPA lassen sich aber auch einzelne Spielszenen (Frames) untersuchen und herausfinden, wie sich diese in Sachen Funktionsaufrufe, etc. verhalten. Damit weiß man ziemlich genau, an welchen Stellen es “klemmt” und auf dieser Erkenntnis kann man probehalber einzelne Prozessorkerne “abschalten”, neue oder aufwändigere Texturen laden oder den Shader “umschreiben”, um somit eine optimierte Variante der betreffenden Szene zu erhalten. Denn oft sind es Kleinigkeiten, die ein 3D-Game ausbremsen.
  • Mit Intel GPA lässt sich zwar nicht nur Intel-Grafikhardware adressieren, aber aufgrund der architektonischen Unterschiede gelingt dies natürlich am besten. Damit kann man genau messen, wieviel Bandbreite die verwendeten Texturen beanspruchen, wie viel Rechenzeit die Shader verbraten, etc. Damit weiß man ganz genau, an welchen Stellen es klemmt – und was man tun sollte, um diese Flaschenhälse zu beseitigen.

Tja, und den Rest schaut ihr euch am besten selbst an. Film ab!

Kategorien : Visual Computing Tags : , , , ,

Maxon setzt auf Intel Softwaretools für optimierte Apps

veröffentlicht von am 16. Dezember 2009 (1) Kommentar

Dass Maxon alles dafür getan hat, ihre Software-Anwendungen wie Cinema 4D für die aktuellen Intel-Prozessoren zu optimieren, darüber habe ich schon vor längeren gebloggt. Und wie es der Zufall wollte (ok, der natürlich keiner war), konnten wir mit Maxon höchstpersönlich darüber reden, wie sie es immer wieder schaffen, dass ihre Anwendungen besonders performant auf Rechnern mit Intel-Architektur laufen.

Ein wesentlicher Punkt ist unter anderem der Einsatz des Intel C++ Compilers, der laut Maxon schon mal ohne nennenswerte Änderungen am Code etwa 15 Prozent mehr Speed bringt. Aber auch der Intel Thread Profiler steht bei Maxon ganz oben auf der Liste, wenn es darum geht herauszufinden, wie sich das parallelisierte Programm verhält, ob also die anfallenden Threads möglichst gleichmäßig auf die vorhandenen Ressourcen verteilt werden (Skalierung ist hier das Zauberwort).

Darüber hinaus kommen VTune Performance Analyzer und Intel Threading Building Blocks zur Sprache. Ok, dann würde ich mal sagen, den Rest solltet ihr euch am besten selbst ansehen. Viel Spaß dabei!

Kategorien : Multicore Tags : , , ,

Parallel Talk: Warum Ct und Rapidmind gut zusammenpassen

veröffentlicht von am 27. November 2009 (1) Kommentar

Auf dem diesjährigen IDF in San Francisco wurde ich selbst “Opfer”, als ich mich unversehens vor dem Whiteboard von Aaron Tersteeg wiederfand. Aber zum Glück ging es nicht nur mir so, sondern auch unter anderem Stefanus, Michael und Anwar von Intel, die etwas sagen sollten über die Ct-Technologie und warum diese mit den Paralleltechniken von Rapidmind so gut zusammen passt.

Nur so viel: Ct soll noch in diesem Jahr als Beta verfügbar sein und Software-Entwicklern dabei helfen, ihre Anwendungen noch eleganter zu parallelisieren als bisher. Und genau dieses Bestreben verfolgen auch die Jungs von Rapidmind. Das dürfte wohl der wesentliche Grund gewesen sein, warum Intel und Rapidmind seit Ende August gemeinsame Sache machen.

Aber am besten lassen wir Stefeanus, Michal und Anwar selbst zu Wort kommen …

Kategorien : Multicore Tags : , ,

Wie .NET-Entwickler mit VTune Bottlenecks finden können

veröffentlicht von am 17. November 2009 (0) Kommentare

Vergangene Woche auf der Microsoft TechEd Europe 2009 hatten wir die Gelegenheit, uns von Rami Radi zeigen zu lassen, wie .NET-Entwickler mithilfe des Profiling- und Samplingtools VTune Performance Analyzer Schwachstellen in ihren Anwendungen aufspüren und beheben können. Dabei geht es beispielsweise sehr oft um Schleifenkonstrukte, die unverhältnismäßig viel CPU-Zeit in Anspruch nehmen, was mit den richtigen Tricks gar nicht notwendig wäre. Für alle, die also in Zukunft mehr aus ihrer Software herausholen wollen, sei dieser Video-Workshop wärmstens empfohlen.

Kategorien : Multicore Tags : , , ,

TechEd09: Wie die CCR .NET-Entwicklern bei der Parallelprogrammierung hilft

veröffentlicht von am 12. November 2009 (1) Kommentar

Die erste Session, die ich hier am vierten Tag der Microsoft TechEd besucht habe, wurde von Ralf Westphal gehalten, der in gewohnt unterhaltsamer und fundierter Weise das Thema asynchrone Programmierung vorstellte. Hauptsächlich auf Basis der Concurrency Coordination Runtime (CCR), die Microsoft mit Einführung des .NET-Frameworks 3.5 implementiert hat. Für alle, die mit dem Begriff CCR nicht so viel anfangen können, gibt’s auf MSDN einen kurzen Überblick.

Die erste interessante Aussage, die Ralf während seiner 75-Minuten-Session abgefeuert hat, war die Erkenntnis, dass Software-Entwickler sich selbst um das Parallelisieren ihrer Anwendungen kümmern müssen und dies nicht nur dem Betriebssystem oder anderen Instanzen überlassen dürfen. Ein weiterer Satz war nicht ganz überraschend und auch nicht neu, dafür umso wichtiger: “The free lunch is over!” Dieser Ausspruch stammt übrigens nicht von Ralf, sondern von Herb Sutter, der das bereits 2005 formuliert hat. Die Grundaussage dahinter lautet:

Künftige Prozessoren werden nicht mehr unendlich schneller, sind dafür mit immer mehr CPU-Kernen ausgestattet. Daher müssen Programmierer umdenken, um ihre Anwendungen in Zukunft zu beschleunigen.


weiterlesen…

Kategorien : Multicore Tags : , , ,

Videochat: Die Zukunft der Parallelprogrammierung

veröffentlicht von am 11. November 2009 (0) Kommentare

Jetzt weiß ich zumindest, was eine “Birds of a feather”-Session ist: Viele interessierte Menschen kommen in einem mittelgroßen Raum zusammen, hören einem gut informierten Spezialisten bei seinen Ausführungen zu und mittendrin entsteht eine lebhafte Diskussion, die viele neue (aber auch bekannte) Erkenntnisse bringt. So geschehen heute Mittag am dritten Tag der Microsoft TechEd Europe 2009, wo ich der Techsession von Tiberiu Covaci beiwohnte, auf der er eine Menge zum Thema “Zukunft der Parallelprogrammierung” beizutragen hatte.

Sein Vortrag hatte allerdings eher den Charakter eines technischen Workshops, indem er selbst zunächst eine Menge zum Thema Intel, Microsoft und Multicore-Shift inklusive .NET 4 und Visual Studio 2010 erzählt hat. Auszüge gefällig?

TPL of .NET 4 delivers the right number of threads regarding the available number of cores/threads.

Needs around 200.000 instruction cycles to create a thread and 100.000 for releasing it again. As a developer you have take this into account!

TPL delivers several parallel classes like Parallel.For() and Parallel.Invoke which abstracts threads to tasks.

Visual Studio 2010 will deliver the appropriate debugger tools for parallelized applications.

Was seiner Techsession allerdings ein wenig fehlte war der Blick in seine Glaskugel, die uns Anwesenden etwas über die Zukunft der Parallelprogrammierung hätte erzählen können. Zumindest war ich genau aus diesem Grund in seinem Vortrag. Das ließ sich allerdings ganz schnell nachholen, indem wir unsere Videokamera aufgebaut und Tiberiu drei schlaue Fragen gestellt haben. Die erste handelt vom Inhalt seiner Präsentation, Nummer zwei beschäftigt sich mit seiner Podiumsdiskussion vom Montag und mit der Beantwortung von Frage drei ließ er uns in die Zukunft der Parallelprogrammierung blicken.

Nur so viel dazu: Laut Tiberiu müssen sich Software-Entwickler ab sofort mit Multithreading und Co. auseinander setzen, denn der Multicore-Shift hat schon längst begonnen. Und den Rest schaut ihr euch am besten selbst an, sobald unser Videointerview fertig und online ist.

Update: Das Video ist fertig!

Kategorien : Multicore Tags : , ,

Videochat: Wie .NET-Entwickler von Multithreading profitieren

veröffentlicht von am 11. November 2009 (1) Kommentar

Der dritte Tag der Microsoft TechEd Europe 2009 begann mit der sehr anschaulichen und technisch höchst anspruchsvollen Techsession von Rami Radi, der bei Intel als Software-Ingenieur arbeitet und anderen Entwicklern hilft, ihre Anwendungen multicore-tauglich zu machen.

Zunächst einmal muss festgehalten werden, dass die Session genauso gut besucht war wie die gestrige von Steve Teixeira. Darüber hinaus wurde schnell klar, dass die meisten Anwesenden weder wussten, dass Intel noch etwas anderes produziert als Mikroprozessoren, noch die Intel-Tools wie VTune Performance Analyzer kannten (was angesichts des “weder” keine Überrraschung war).

Ramis Präsentation befasste sich mit drei Kerngebieten: Intels aktuelle und zukünftige Mikroprozessor-Architekturen, .NET-4-Verbesserungen in Sachen Multithreading und wie Intel-Tools wie der besagte VTune Performance Analyzer Software-Entwicklern helfen können, ihre Apps auf Korrekheit hin zu überprüfen. Zu diesem Behufe sagte Rami einige bemerkenswerte Dinge:

Moore’s law doesn’t help software developers anymore as frequencies aren’t going up anymore. The good news: the number of core does!

With Nehalem you get Non Uniform Memory Acess (NUMA) which connects every CPU and memory to each other which has huge advantages.

Come to Intel booth in hall 4.2 to see one of the first desktop PCs which is able to run 128 threads in parallel!

Multithreading is not equal parallelism!

Poor scaling .NET applications can be powered up with the help of Intel VTune Performance Analyzer and Visual Studio 2010 / .NET 4

.NET 4 provides the Background Garbage Collection which speeds up managed code significantly.

Worker stealing within .NET 4 will help to achieve better multithreaded balanced managed applications.

VTune profiles and samples .NET applications in order to find critical code sections where a lot of computing time is being wasted

Vtune also helps identifying false sharing problems. Means VTune will detect and solve cache line misses.

To eliminate  false sharing problems helps to speed up your .NET apps on 8 core system by 70x!

weiterlesen…

Kategorien : Multicore Tags : , , ,

Intel-Session “Parallel Studio” und eine Netbook-Verlosung

veröffentlicht von am 10. November 2009 (2) Kommentare

Um 16:30 Uhr betrat Ralph de Wargny die Bühne des Visual Studio Partner-Theaters, um ein wenig über Intel Parallel Studio zu erzählen und um ein Netbook zu verlosen, für das gestern und heute eine Menge Leute Frageb beantwortet haben. Ralphs Präsentation gibt es wie gewohnt als Twitter-Stream-Auszug:

Intel Parallel Studio = Amplifier + Inspector + Composer + Advisor = Multicore optimization

Parallel Advisor helps you to parallelize your native code. But from 2010 onwards only.

With Parallel Inspector you find memory errors before they happen. Works on serial AND threaded code.

Intel Parallel Amplifier is a child of VTune Performance Analyzer, but easier and more intuitively to use. Profile you parallel code.

On http://wwwintel.com/go/para… you’ll find more information about Parallel Studio and more.

Nach der Parallel-Studio-Session gab es das dann das lang ersehnte Netbook, ein Sony Vaio. Sehr schickes Teil. Der Durchgang zwischen Theater und Intel-Stand war entsprechend für eine kurze Zeitspanne komplett verstopft. Kein Wunder: Netbooks sind gerade der große Renner.

Für alle, die nicht dabei sein konnten, haben wir Ralphs Vortrag und die Netbook-Verlosung mit unserer JVC-Kamera auf SD-Karte gespeichert. Sobald Tom die besten Bilder zusammengeschnitten hat, geht das Video hier online.

Update: Hier ist das Video. Viel Spaß damit!

Kategorien : Multicore Tags : , , ,