Abschluss des MWC, Windows 8, Prozessorengeflüster & Webinar!
Schluss beim MWC. Für Besucher und Aussteller war der weltweit größte Event für Mobil-Technologie diesem Jahr sicher gleichermaßen spannend und aufschlussreich. Zum einen hat Intel seine internationalen Smartphone-Planungen erläutert und dabei auch gleich ein paar neue Partnerschaften bekannt gegeben, in deren Folge auch neue Geräte erscheinen werden. Prototypen gab es bereits zu sehen, und die Presse hat das Thema begeistert aufgenommen. Selbst erste Rezensionen gibt es schon im Web!. Leider sind die Orange-Smartphones auf Android-Basis (vorerst) nicht für den deutschen Markt bestimmt.
Hier können Sie das alles noch einmal in Ruhe nachlesen.
Der Name Intel fiel unweigerlich auch, als es um ein weiteres Highlight des Kongresses ging: Windows 8. Am Mittwoch wurde die Consumer-Preview zum Download freigegeben, und im gleichen Zuge erläuterte Microsoft seine neue Windows-Strategie. Keine Überraschung: Das neue Multiplattform-System ist gleichermaßen auf ARM- als auch auf Intel-Chips ausgerichtet. Schon beim Besuch im Windows-Store will Microsoft die Zielarchitektur korrekt erkennen und ausschließlich die passende Software anbieten. Klingt gut.
Mit der Installation dieser ersten Vorabversion Windows 8 sollten aber noch alle warten, die kein separates Testgerät zur Verfügung haben. Zwar läuft die 8er-Version stabil, aber es gibt verständlicherweise noch eine Reihe von Kompatibilitätsproblemen, so dass unter Umständen bestimmte HW-Geräte nicht angesteuert werden können. Allerdings sagt Microsoft ganz offiziell, dass Windows 8 auf allen Rechnern laufen soll, die auch Windows-7-kompatibel sind.
Bleiben wir beim Thema Chips: Da ist Intel doch tatsächlich ein „vertrauliches“ PDF zu neuen Intel-Prozessoren (Ivy-Bridge) im 22-Nanometer-Fertigungsverfahren rausgerutscht. Was für ein Malheur…. Nun ja, die Planspiele reichen bis April 2012, insofern verraten wir keine Staatsgeheimnisse, wenn wir das PDF verlinken.
Fakt ist, die Liste gibt einen recht guten Überblick zu den kommenden Desktop- und Laptop-CPUs, letztere auch relevant für Ultrabooks. Wenn das Ganze über den Gerüchtestatus hinausgewachsen ist, werden wir uns dazu detailliert äußern.
Noch ein ganz anderes Thema für Spiele- und Parallelprogrammierer:
Am 7. März, 23.00 Uhr MEZ findet ein Webinar zum Thema AVX Optimization statt. Während der kostenlosen Veranstaltung wird anhand eines Samples gezeigt, wie Sie grafische Berechnungen beschleunigen: „In this webcast, we will demonstrate a tech sample using AVX. The sample has many active cloth pieces simulating as it showcases an SOA implementation of an iterative position projection (distance constraint based) solver.“
Hier geht es zur Anmeldung. Die Sprache ist Englisch.
Intel veröffentlicht OpenCL SDK 1.5
Das wäre fast untergangenen angesichts der vielen wichtigen Veranstaltungen und Programmier-Wettbewerbe der nächsten Wochen:
Intel hat eine Update-Version des OpenCL SDK veröffentlicht mit einigen wichtigen neuen Funktionen und Performance-Verbesserungen. Das OpenCL SDK 1.5 steht unter der Adresse www.intel.com/go/opencl zum kostenlosen Download bereit. Damit wird es nun deutlich leichter, OpenCL-Anwendungen zu schreiben, zu debuggen und zu optimieren. Das SDK ist für Intel Core- und Intel Xeon-Prozessoren verfügbar.
Zur deutlichen Geschwindigkeitsverbesserung führt die Nutzung der Intel Advanced Vector Extensions (Intel AVX) bei der Code-Generierung. AVX ist eine Erweiterung für SSE mit 256 Bit Registerbreite, die deutlich so schnellere Vektorberechnungen ermöglicht und mit Sandy Bridge eingeführt wurde. AVX ist vor allem Floating Point-intensive Anwendungen interessant. Zum Thema AVX hat dieser Blog ja schon häufig und sehr ausführlich berichtet. Zudem finden Sie bei ISN eine sehr gute Zusammenfassung.
Über das so genannte Implicit CPU Vectorization Module im Intel OpenCL SDK Compiler können Sie nun nahtlos die volle Performance der Intel-Architektur ausschöpfen, indem Sie für den OpenCL-Kernel Code die Auto-Vektorisierung nutzen. Mehr dazu erfahren Sie auf dieser Seite.
Zudem enthält die neue Version nun auch den Intel OpenCL SDK Offline Compiler for Linux. Mit diesem Standalone-Tool können Sie Kernels offline erzeugen und den Code analysieren.
Auch das Debuggen wurde verbessert. Mit der neuen Beta Version des Intel OpenCL SDK Debugger als Microsoft Visual Studio 2008-Plug-In können Sie ab sofort OpenCL-Applikationen direkt auf der Intel-Plattform debuggen!
Eine Liste aller Neuerungen finden Sie in den Intel OpenCL SDK Release Notes.
GDC Europe 2011: Vorher informiert – doppelt profitiert (II)
Heute der versprochene zweite Teil meiner Vorberichterstattung zur GDC Europe 2011. Gestern ging es um die Sessionvon Leigh Davies unter dem Titel „Efficient Scaling in a tasked based Game Engine“.
Heute stelle ich die beiden Dienstags-Sessions in den Vordergrund.
Dienstag, 16.8.2011: Ab 9:30 Uhr spricht Levent Akyil zum Thema “Hotspot Flops & uOps”. Levent wird verdeutlichen, wie sich seriell und parallel programmierte Anwendungen durch eine recht simple Optimierung auf Registerebene weiter beschleunigen und Fehler wie Bottlenecks in Quellcode aufspüren und beheben lassen. Dabei geht Levent detailliert auf die Möglichkeiten der aktuellen Sandy Bridge-Architektur mit AVX ein – von der sowohl Programmierer als auch Spieler erheblich profitieren.
Wenn Sie sich zuvor über die Advanced Vector Extension, eine verbesserte Vektorisierung von Gleitkomma- und Ganzpunktzahlen, informieren möchten, empfehlen wir Ihnen unseren Grundlagenartikel „Sandy Bridge: Schnellere Apps dank breiteren AVX-Registern“. Zudem lohnt ein Streifzug durch diesen Blog, denn AVX im Zusammenhang mit der Programmierung und der verbesserten Grafikleistung von 3D-Games war sehr häufig Thema bei uns.
Levent habe ich übrigens im Mai beim Black Belt Event in München getroffen, wo er die aktuellen Programmier- und Analyse-Tools vorgestellt hat, allen voran natürlich Intel Parallel Studio XE mit dem Composer, dem Inspector und dem VTune Amplifier. Anhand der Amplifier-Werkzeuge zeigte Levent, wie sich typische Speicherprobleme im Code ausfindig machen lassen und wie Entwickler feststellen können, wo sich im Code Performance-Schwachstellen verbergen.
Hierzu empfehle ich auch meinen Report von der Intel Software Conference in Dubrovnik vom April dieses Jahres: Intel Software Developer Conference 2011 (II): Intel VTune Amplifier XE in Action.
Levent ist nicht nur ein hervorragender Redner, sondern auch sehr sympathisch. Sie sollten die Chance nutzen, seine Session zu besuchen und vielleicht auch ein paar Worte mit ihm am Intel-Stand zu wechseln.
Die offizielle Ankündigung zu seiner Session können Sie auf der GDCE-Seite abrufen.
Dienstag, 16.8.2011: Ab 17:40 Uhr kommt dann Philipp Gerasimov zu Wort. Er wird in seiner Session zeigen, wie sich der Action-RPG-Titel Darkspore mit Hilfe des Analyse-Toolsets Intel GPA für Notebooks optimieren lassen konnte. Hierzu gehört detailliertes Wissen über die Version 4.0 des Tools, aber auch die Neuerungen der Version 4.1 wie der verbesserte Platform Analyzer und das In-Game-HUD werden vorgestellt. Im Einzelnen wird Philipp auf den Frame Analyzer näher eingehen und außerdem zeigen, wie sich mit dem Platform Analyzer der eigene Spieletitel auf die Multicore-Fähigkeiten hin untersuchen lässt.
Die offizielle Ankündigung zu seiner Session können Sie auf der GDCE-Seite abrufen.
Intel GPA war und ist ebenfalls immer wieder Thema dieses Blogs, so dass Sie über diese Seiten sehr gut vorbereiten oder auch einiges nachlesen können. Empfehlenswert auf jeden Fall die Beiträge: „Das sagen bekannte Spieleentwickler über Intel Graphics Performance Analyzers“ und „Wie LEGO Univers mithilfe von Intel GPA optimiert wurde“ . Letzter Tipp für alle, die die neue Version GPA 4.1 selbst ausprobieren möchten: Auf dieser Seite finden Sie eine kostenlose Download-Option.
Mit Haswell bringt Intel 2013 neue Prozessorgeneration und neue Befehlssätze auf den Markt
Kaum hat sich die aktuelle Prozessorgeneration Sandy Bridge etabliert, schon kündigt Intel die nächsten Schritte an. Unter dem Codenamen Haswell soll es wieder einmal große Veränderungen geben. Zuvor ist allerdings im kommenden Jahr erst einmal die nächste Fertigungstechnik an der Reihe, der 22-Nanometer-Prozess mit dem Codenamen Ivy Bridge.
Aus Entwicklersicht wird sich mit Haswell eine ganze Menge hinsichtlich des mit Sandy Bridge eingeführten AVX-Befehlssatzes tun. So werden unter der Bezeichnung AVX2 folgende Änderungen Einzug halten:
- Integer-Register werden ebenfalls 256 Bit breit sein, was SIMD-Befehle entsprechend beschleunigen wird. Bisher stehen 256-Bit-Register nur für Floating-Point-Befehle zur Verfügung.
- Fused Multiply Add: Von der Kombination aus einer Multiplikation und Addition verspricht sich Intel eine deutliche Beschleunigung von dieser arithmetischen Befehlskombination, die in der Praxis sehr häufig vorkommt. Aber auch die Rechengenauigkeit wird duch Fused Multiply Add zunehmen, da nur noch einmal gerundet werden muss. Auf diesem Weg lassen sich übrigens auch Multiply-Subtract-Befehle zusammenfassen.
- Neue Befehle für Bit-Manipulationen: Befehle wie ANDN (And not) oder BLSI (Extract Lowest Bit Set) sollen vor allem in den Bereichen “Komprimierte Datenbanken” und bei der Manipulation sehr großer Zahlen eine wesentliche Rolle spielen.
- Any-to-Any-Permutes: Auf Basis von DWORD- und QWORD-Vektorregistern, die 256 Bit breit sein können, lassen sich in Zukunft mit AVX2 beliebige Befehle innerhalb eines Registern verschieben.
Zusammenfassend kann man also sagen, dass AVX2 ein weiterer Schritt in Richtung register-basierte, parallele Datenverarbeitung gehen wird. Gerade die 256-Bit-Register für Integer-Arithmetik werden sich vor allem positiv auf die Bild- und Videobearbeitung auswirken, da hier vorwiegend mit Ganzpunktzahlen operiert wird.
Wer sich schon einmal den geplanten Befehlssatz zu Gemüte führen möchte, kann dies mit Hilfe des sehr umfangreichen PDF-Dokuments tun, das Intel zum kostenlosen Download anbietet.
Sandy Bridge, AVX und Core-CPUs: GCC 4.6 mag Intel
Wie heise developer berichtet, hat das GCC-Team die Version 4.6.0 der GNU Compiler Collection veröffentlicht.
Zu den wesentlichen Verbesserungen der frei erhältlichen Linux-Compiler-Sammlung gehören unter anderem folgende Dinge:
>> Dank des AVX-Supports ist GCC 4.6 ab sofort für alle Sandy-Bridge-nahen Software-Projekte interessant. Damit werden mithilfe von -march=corei7-avx and -mtune=corei7-avx die aktuellen Core i3-, Core i5- und Core i7-Prozessoren auf Sandy-Bridge-Basis besser unterstützt.
Das bedeutet vor allem den Support der neuen 256 Bit breiten Register und der zugehörigen, register-nahen Befehlssätze. Daneben konnte aber auch das Zusammenspiel mit ARM-CPUs (Cortex-M4 und Cortex-A15) verbessert werden. Außerdem lassen sich mit GCC 4.6 Floating-Point-Operationen default-mäßig bei der Konfiguration einschalten. Dies geschieht mit dem Schalter –with-fpmath=avx.
>> Die Kompilierungszeiten konnten verkürzt werden und notwendiger Speicher wird effizienter genutzt. Die Kompilierzeiten sind vor allem bei Codeabschnitten mit umfangreichen Funktionen verbessert worden, die nicht vollständig in den Cache passen. Bei Tests auf 64-Bit-x86-Maschinen wurde eine Geschwindigkeitszunahme von 10 Prozent gemessen.
>> Pragma-basierte Fehlerwarnungen können jetzt mittels #pragma GCC diagnostic ein- und ausgeschaltet werden. Das ist beispielsweise für OpenMP-Programmabschnitte interessant.
>> Interessant ist auch die Verbesserung des – zumindest experimentellen – Supports des künftigen C++0x-Standards. Es lassen sich constexpr und nullptr inkludieren.
>> Der Support von Fortran 2003 und 2008 wurde verlängert.
GCC 4.6 wird wohl Mitte Mai in Fedora 15 Einzug halten, allerdings nicht der Standard-Compiler von Ubuntu 11.04 sein, das Ende April erwartet wird. Sämtliche Verbesserungen und Ergänzungen findet man auf der zugehörigen Webseite.
Ausblick auf die Intel Software Conference 2011 in Dubrovnik
Große Ereignisse werfen ihre Schatten voraus – das gilt auch für Intels wichtigste europäische Konferenz für Software-Entwickler. Die findet am 12. und 13. April in Dubrovnik (Kroatien) statt. Aufgrund der Fülle an neuen Prozessoren wie der Sandy Bridge-Generation und neuen Entwickler-Tools wie Parallel Studio erwartet die Besucher dieses Mal ein spannendes Programm, das sowohl Einsatzszenarien für die aktuell verfügbaren Technologien schildert als auch einen Blick in die Zukunft wirft.
Das Motto der Veranstaltung lautet „Unleashing performance“ (frei übersetzt: „Leistung freisetzen“). Experten von Intel und Partnerunternehmen werden dabei anhand von Szenarien herausstellen, wie Entwickler die schnelleren Prozessoren, die bessere Grafikunterstützung und die darauf abgestellten Developer-Tools und Parallel Programming Modelle gewinnbringend einsetzen.
Zudem geht es auch um mobile Devices wie MeeGo, das in Barcelona eine sehr erfolgreiche Fortsetzung hingelegt hat.
Hier einige der Highlights der Veranstaltung:
- Aaron Coday, Manager Application Engineering bei Intel, spricht über Sandy Bridge und die neuen Performance-Technologien wie AVX und Turbo Boost 2.0, die die Prozessoren bieten. Und natürlich erläutert er, wie Entwickler davon profitieren
- Über Software-Ecosysteme wird James Reinders, Chief Software Evangelist bei Intel sprechen und zwar sowohl für Client- als auch für Embedded Software-Entwicklung und erklärt Intels Strategie in den nächsten Jahren.
- An Parallel-Programmierer wendet sich der zweite Vortrag von James Reinders. Hier beschreibt er das Konzept der Intel Parallel Building Blocks (Intel PBB) und wird sicher auch praktische Anwendungsbeispiele in petto haben, die das eine oder andere Programmierproblem lösen können.
- Weg von der Theorie, rein in die Praxis geht Manuel Wille, Vice President of Engineering bei Nik Software, wenn er darüber referiert, wie auch Profi-und Hobbyfotografen von Multicore-Architekturen und AVX profitieren und bei der Arbeit jede Menge Zeit sparen können.
- Intels VTune Amplifier XE in Aktion ist das Thema von Levent Akyil, Software Engineer bei Intel. Er adressiert in seinem Vortrag vor allem Spiele-Entwickler, die mit Hilfe von VTune Amplifier XE die Prozessor-Power vollständig für ihre Games nutzen können.
Ich werde im Übrigen live von der Veranstaltung bloggen und sicherlich auch das eine oder andere interessante Video-Interview mitbringen. Ich freue mich drauf!
AVX-Wettbewerb: Noch bis zum 31.3.2011 mitmachen und gewinnen!
Sie haben sich noch nicht für den Black-Belt-Wettbewerb zum Thema „AVX“ angemeldet? Dann wird es aber höchste Zeit! Das Black Belt „Defenders of the Code“-Programm läuft nur noch bis zum 31. März 2011. Noch haben Sie aber beste Chancen, sich für das Sieger-Event im Mai in München zu qualifizieren.
Und darum geht es: Sie registrieren sich im Intel Software Network (ISN), der von Intel initiierten, internationalen Entwickler-Community, und tauschen sich mit anderen Anwendern und Entwicklern zum Thema Intel Advanced Vector Extensions (Intel AVX) aus.
Falls Sie noch nicht so viele Erfahrungen zum Thema AVX gesammelt haben, empfehlen wir Ihnen zum Beispiel diese Beiträge aus meinem Blog als Inspiration:
- Wie Entwickler von neuen Sandy-Bridge-Registern und -Ops profitieren
- Video-Apps mit Intel Media SDK beschleunigen
- Ein Compiler für (fast) alles: Intel Composer XE 2011
- Parallel Studio XE: Key-Features und Anwendungsmöglichkeiten
- Vorschau auf die OOP 2011, AVX-Codebeispiel und ein Video zu Sandy Bridge
Zudem bietet das ISN selbstverständlich massenhaft gute Beiträge zu dem Thema:
- Intel AVX and CPU Instructions
- Intel AVX C/C++ Intrinsics Emulation – Intel Software Network
- The Intel AVX Realization of Lanczos interpolation in Intel® IPP 2D Resize Transform
- How to Compile for Intel AVX – Intel Software Network
- 3D Vector Normalization Using 256-Bit Intel Advanced Vector Extensions
- Enabling Intel Advanced Vector Extensions (Intel AVX) optimizations in Intel MKL
- How to call Intel AVX based code with Intel® IPP version 6.1
- Intel Integrated Performance Primitives (Intel IPP) Functions Optimized for Intel AVX
- —und zahlreiche weitere Artikel zum Thema AVX finden Sie hier.
So nehmen Sie teil: Registrieren Sie sich auf der Seite für das AVX-Special, und begleiten Sie die laufenden Diskussionen, erstellen Sie eigene, interessante Beiträge und holen Sie das Feedback Ihrer internationalen Kollegen ein. Das alles sollte in englischer Sprache erfolgen.
Das können Sie gewinnen: Insgesamt werden die jeweils zehn aktivsten Forumsmitglieder aus Deutschland und Großbritannien gesucht. Dabei kommt es naturgemäß darauf an, dass Sie möglichst viele Postings erstellen. Die Gewinner werden bis zum 20. April bekannt gegeben. Im Mai folgt dann ein exklusives Get-together mit Intel-Experten, Black-Belt-Entwicklern und den weiteren Gewinnern in München.
Reisekosten werden bis zu einer Höhe von 300 Euro übernommen. Ganz sicher werden dann auch absolute Profi-Programmierer aus dem Nähkästchen plaudern und Ihnen den einen oder anderen Tipp verraten, den Sie im Web nicht ohne weiteres finden. Und natürlich gibt es tolles Essen und leckere Drinks, die im Laufe des Abends auch dafür sorgen, dass nicht „nur“ über Parallel Programming und Visual Computing gesprochen wird.
Die Teilnahmebedingungen können Sie hier im Detail abrufen.
Viel Erfolg!
