Algorithmic Trading System Architecture Auparavant sur ce blog, j'ai écrit sur l'architecture conceptuelle d'un système de négociation algorithmique intelligent ainsi que les exigences fonctionnelles et non fonctionnelles d'un système de trading algorithmique de production. Depuis, j'ai conçu une architecture de système qui, je crois, pourrait satisfaire ces exigences architecturales. Dans ce post, je vais décrire l'architecture en suivant les directives de la norme ISOIECIEEE 42010 systèmes et la description de l'architecture d'ingénierie logicielle. Selon cette norme, une description d'architecture doit: Contenir plusieurs vues architecturales normalisées (par exemple, UML) et Maintenir la traçabilité entre les décisions de conception et les exigences architecturales Définition de l'architecture logicielle Il n'y a toujours pas de consensus sur ce qu'est une architecture système. Dans le contexte de cet article, il est défini comme l'infrastructure dans laquelle les composants d'application qui satisfont aux exigences fonctionnelles peuvent être spécifiés, déployés et exécutés. Les exigences fonctionnelles sont les fonctions attendues du système et de ses composantes. Les exigences non fonctionnelles sont des mesures permettant de mesurer la qualité du système. Un système qui satisfait pleinement à ses exigences fonctionnelles peut toujours ne pas répondre aux attentes si les exigences non fonctionnelles ne sont pas satisfaites. Pour illustrer ce concept, considérez le scénario suivant: un système de négociation algorithmique que vous venez d'acheter construit fait d'excellentes décisions commerciales, mais il est totalement inopérant avec les systèmes de gestion des risques et de comptabilité des organisations. Ce système répondrait à vos attentes Architecture conceptuelle Une vue conceptuelle décrit les concepts et les mécanismes de haut niveau qui existent dans le système au plus haut niveau de granularité. A ce niveau, le système de négociation algorithmique suit une architecture événementielle (EDA) décomposée en quatre couches, et deux aspects architecturaux. Pour chaque couche et aspect, les architectures et les modèles de référence sont utilisés. Les modèles architecturaux sont des structures génériques prouvées pour répondre à des exigences spécifiques. Les aspects architecturaux sont des préoccupations transversales qui couvrent plusieurs composantes. Architecture événementielle - une architecture qui produit, détecte, consomme et réagit aux événements. Les événements comprennent des mouvements de marché en temps réel, des événements ou des tendances complexes et des événements commerciaux, par ex. Soumettre une commande. Ce diagramme illustre l'architecture conceptuelle du système de négociation algorithmique Architectures de référence Pour utiliser une analogie, une architecture de référence est semblable aux plans pour un mur porteur. Cette impression bleue peut être réutilisée pour plusieurs constructions indépendamment du bâtiment en construction car elle répond à un ensemble d'exigences courantes. De même, une architecture de référence définit un modèle contenant des structures et des mécanismes génériques qui peuvent être utilisés pour construire une architecture logicielle concrète satisfaisant des exigences spécifiques. L'architecture du système de négociation algorithmique utilise une architecture basée sur l'espace (SBA) et un contrôleur de vue modèle (MVC) comme références. On utilise également de bonnes pratiques telles que le stockage des données opérationnelles (ODS), le modèle de transformation et de chargement des extraits (ETL) et un entrepôt de données (DW). Modèle contrôleur de vue - un modèle qui sépare la représentation de l'information de l'interaction des utilisateurs avec elle. Architecture basée sur l'espace - spécifie une infrastructure où les unités de traitement lâchement couplées interagissent les unes avec les autres à travers une mémoire associative partagée appelée espace (illustrée ci-dessous). Vue structurelle La vue structurelle d'une architecture montre les composants et les sous-composantes du système de négociation algorithmique. Il montre également comment ces composants sont déployés sur l'infrastructure physique. Les diagrammes UML utilisés dans cette vue incluent des diagrammes de composants et des diagrammes de déploiement. Vous trouverez ci-dessous la galerie des diagrammes de déploiement du système global de négociation algorithmique et des unités de traitement dans l'architecture de référence SBA, ainsi que des diagrammes de composants associés pour chacune des couches. Tactique architecturale Selon l'institut de génie logiciel, une tactique architecturale est un moyen de satisfaire une exigence de qualité en manipulant un aspect d'un modèle d'attribut de qualité par des décisions de conception architecturale. Un exemple simple utilisé dans l'architecture de système de négociation algorithmique est la manipulation d'un magasin de données opérationnelles (ODS) avec un composant d'interrogation continue. Cette composante analyserait en continu les SAO pour identifier et extraire des événements complexes. Les tactiques suivantes sont utilisées dans l'architecture: Le modèle de disrupteur dans les files d'attente d'événement et d'ordre Mémoire partagée pour les files d'attente d'événements et d'ordre Langue de requête continue (CQL) sur le ODS Filtrage des données avec le modèle de filtre sur les données entrantes Algorithmes d'évitement de congestion sur tous Des connexions entrantes et sortantes Gestion active des files d'attente (AQM) et notification d'encombrement explicite Ressources de calcul des marchandises avec capacité de mise à niveau (évolutive) Redondance active pour tous les points d'échec individuels Indexation et structures de persistance optimisées dans les ODS ODS Historiques des transactions sur toutes les bases de données Checksums pour tous les ordres de détection des fautes Annoter les événements avec des horodatages pour ignorer les événements obsolètes Règles de validation des ordres Quantités commerciales maximales Les composants commerciaux automatisés utilisent une base de données en mémoire pour l'analyse Authentification en deux étapes pour les interfaces utilisateur se connectant aux AT Encryption sur les interfaces utilisateur et les connexions aux ATs Modèle de conception Observer pour MVC pour gérer les vues La liste ci - Décisions que j'ai identifiées lors de la conception de l'architecture. Ce n'est pas une liste complète de tactiques. Au fur et à mesure que le système est en cours d'élaboration, des tactiques additionnelles doivent être employées à plusieurs niveaux de granularité pour répondre aux exigences fonctionnelles et non fonctionnelles. Vous trouverez ci-dessous trois diagrammes décrivant le motif de conception du disrupteur, le modèle de conception du filtre et le composant d'interrogation continue. Vue comportementale Cette vue d'une architecture montre comment les composants et les couches doivent interagir les uns avec les autres. Ceci est utile lors de la création de scénarios pour tester des conceptions d'architecture et pour comprendre le système de bout en bout. Cette vue est constituée de diagrammes de séquence et de diagrammes d'activité. Les diagrammes d'activité montrant le processus interne des systèmes de négociation algorithmique et la façon dont les opérateurs sont censés interagir avec le système de négociation algorithmique sont présentés ci-dessous. Technologies et cadres La dernière étape dans la conception d'une architecture logicielle est d'identifier les technologies et les cadres qui pourraient être utilisés pour réaliser l'architecture. En règle générale, il est préférable de tirer parti des technologies existantes, à condition qu'elles répondent adéquatement aux exigences tant fonctionnelles que non fonctionnelles. Un cadre est une architecture de référence réalisée, par ex. JBoss est un framework qui réalise l'architecture de référence JEE. Les technologies et les cadres suivants sont intéressants et devraient être pris en compte lors de la mise en œuvre d'un système de négociation algorithmique: CUDA - NVidia a un certain nombre de produits qui soutiennent la modélisation des finances informatiques de haute performance. On peut atteindre jusqu'à 50x améliorations de performance lors de l'exécution de simulations Monte Carlo sur le GPU au lieu du CPU. Apache River - River est un outil-kit utilisé pour développer des systèmes distribués. Il a été utilisé comme un cadre pour la construction d'applications basées sur le modèle SBA Apache Hadoop - dans le cas où l'exploitation forestière omniprésente est une exigence, alors l'utilisation de Hadoop offre une solution intéressante au problème des grandes données. Hadoop peut être déployé dans un environnement clusterisé prenant en charge les technologies CUDA. AlgoTrader - une plateforme de trading algorithmique open source. AlgoTrader pourrait être déployé à la place des composants du trader automatisé. FIX Engine - une application autonome prenant en charge les protocoles FIX (Financial Information Exchange) incluant FIX, FAST et FIXatdl. Bien qu'il ne s'agisse pas d'une technologie ou d'un cadre, les composants doivent être construits avec une interface de programmation d'application (API) pour améliorer l'interopérabilité du système et de ses composants. Conclusion L'architecture proposée a été conçue pour satisfaire aux exigences très génériques identifiées pour les systèmes de négociation algorithmique. D'une manière générale, les systèmes de négociation algorithmique sont compliqués par trois facteurs qui varient selon chaque implémentation: Dépendances des systèmes d'entreprise et d'échange externes Détermination des exigences non fonctionnelles et Évolution des contraintes architecturales L'architecture logicielle proposée devra donc être adaptée au cas par cas Pour satisfaire aux exigences organisationnelles et réglementaires spécifiques, ainsi que pour surmonter les contraintes régionales. L'architecture du système de négociation algorithmique doit être considérée comme un simple point de référence pour les individus et les organisations qui souhaitent concevoir leurs propres systèmes de négociation algorithmique. Pour obtenir une copie complète et les sources utilisées, veuillez télécharger une copie de mon rapport. Nous vous remercions. Architecture de plancher de commerce Architecture de l'architecture Vue d'ensemble de l'exécutif Une concurrence accrue, un volume de données de marché plus élevé et de nouvelles exigences réglementaires sont quelques-unes des forces motrices derrière les changements de l'industrie. Les entreprises essaient de maintenir leur avantage concurrentiel en changeant constamment leurs stratégies commerciales et en augmentant la vitesse de négociation. Une architecture viable doit inclure les dernières technologies à la fois du réseau et des domaines d'application. Il doit être modulaire pour fournir un chemin gérable pour évoluer chaque composant avec une interruption minimale au système global. Par conséquent, l'architecture proposée dans ce document repose sur un cadre de services. Nous examinons les services tels que la messagerie à ultra-faible latence, la surveillance de latence, la multidiffusion, l'informatique, le stockage, la virtualisation des données et des applications, la résilience commerciale, la mobilité commerciale et le client léger. La solution aux exigences complexes de la plate-forme de négociation de prochaine génération doit être construite avec une mentalité holistique, en franchissant les frontières des silos traditionnels comme les affaires et la technologie ou les applications et le réseautage. Ce document a pour objectif principal de fournir des lignes directrices pour la construction d'une plateforme de négociation à ultra-faible latence tout en optimisant le débit brut et le taux de messages pour les données de marché et les ordres de négociation FIX. Pour ce faire, nous proposons les technologies de réduction de latence suivantes: Interconnexion haute vitesseInfiniBand ou connectivité 10 Gbps pour le cluster de négociation Bus de messagerie haute vitesse Accélération de l'application via RDMA sans re-code d'application Surveillance de latence en temps réel et re-direction de Le commerce du trafic sur le chemin avec une latence minimale Tendances et défis de l'industrie Les architectures commerciales de la prochaine génération doivent répondre à la demande accrue de vitesse, de volume et d'efficacité. Par exemple, le volume des données du marché des options devrait doubler après l'introduction de la négociation des penny options en 2007. Il existe également des exigences réglementaires pour la meilleure exécution, qui exigent des mises à jour des prix de traitement à des taux qui s'approchent de 1 ms msec. Pour les échanges. Ils exigent également la visibilité de la fraîcheur des données et la preuve que le client a obtenu la meilleure exécution possible. À court terme, la rapidité des échanges et de l'innovation sont des facteurs de différenciation essentiels. Un nombre croissant de métiers sont traités par des applications de négociation algorithmique placées aussi près que possible du lieu d'exécution du commerce. Un défi avec ces moteurs de trading quotblack-boxquot est qu'ils composent l'augmentation de volume en émettant des ordres seulement pour les annuler et les soumettre à nouveau. La cause de ce comportement est le manque de visibilité sur le lieu qui offre la meilleure exécution. Le commerçant humain est maintenant un ingénieur quotfinancial, quotquantquot (analyste quantitatif) avec des compétences en programmation, qui peut ajuster les modèles de négociation à la volée. Les entreprises développent de nouveaux instruments financiers comme les dérivés météorologiques ou les métiers de classes d'actifs croisés et ils doivent déployer les nouvelles applications rapidement et de manière évolutive. À long terme, la différenciation concurrentielle devrait provenir de l'analyse, et pas seulement du savoir. Les star traders de demain assument des risques, atteignent la perspicacité du client et battent constamment le marché (source IBM: www-935.ibmservicesusimcpdfge510-6270-trader. pdf). La résilience des entreprises est l'une des principales préoccupations des entreprises commerciales depuis le 11 septembre 2001. Les solutions dans ce domaine vont de centres de données redondants situés dans des zones géographiques différentes et connectés à de multiples sites de négociation à des solutions de commerçants virtuels offrant aux commerçants de pouvoir la plupart des fonctionnalités d'un plancher commercial Dans un endroit éloigné. Le secteur des services financiers est l'un des plus exigeants en termes de besoins informatiques. L'industrie connaît une transformation architecturale vers l'architecture orientée services (SOA), les services Web et la virtualisation des ressources informatiques. SOA profite de l'augmentation de la vitesse du réseau pour permettre la liaison dynamique et la virtualisation des composants logiciels. Cela permet de créer de nouvelles applications sans perdre l'investissement dans les systèmes et infrastructures existants. Le concept a le potentiel de révolutionner la manière dont l'intégration est faite, permettant des réductions significatives de la complexité et du coût d'une telle intégration (gigaspacesdownloadMerrilLynchGigaSpacesWP. pdf). Une autre tendance est la consolidation des serveurs dans les batteries de serveurs de datacenter, tandis que les pupitres de négoce n'ont que des extensions KVM et des clients ultra-légers (par exemple, les solutions SunRay et HP). Les réseaux métropolitains à grande vitesse permettent aux données de marché d'être multidiffusées entre différents emplacements, ce qui permet la virtualisation du marché. Architecture de haut niveau La figure 1 illustre l'architecture de haut niveau d'un environnement commercial. Le ticker et les moteurs de trading algorithmique sont situés dans le cluster de trading haute performance du data center de l'entreprise ou à l'échange. Les commerçants humains sont situés dans la zone des applications utilisateur final. Fonctionnellement, il existe deux composants d'application dans l'environnement commercial d'entreprise, les éditeurs et les abonnés. Le bus de messagerie fournit le chemin de communication entre les éditeurs et les abonnés. Il existe deux types de trafic spécifiques à un environnement commercial: Market DataCarries informations sur les prix des instruments financiers, des nouvelles et d'autres informations à valeur ajoutée telles que l'analyse. Il est unidirectionnel et très sensible à la latence, généralement livré sur UDP multicast. Il est mesuré en updatessec. Et en Mbps. Les données de marché proviennent d'un ou de plusieurs flux externes, provenant de fournisseurs de données de marché comme les bourses, les agrégateurs de données et les ECN. Chaque fournisseur a son propre format de données de marché. Les données sont reçues par des gestionnaires d'alimentation, des applications spécialisées qui normalisent et nettoient les données puis les envoient aux consommateurs de données, tels que les moteurs de prix, les applications de négociation algorithmique ou les commerçants humains. Les firmes de vente envoient également les données du marché à leurs clients, aux sociétés d'achat comme les fonds communs de placement, les hedge funds et les autres gestionnaires d'actifs. Certaines entreprises buy-side peuvent opter pour recevoir des flux directs des échanges, ce qui réduit la latence. Figure 1 Architecture de négociation pour une société SideSell côté Buy Il n'existe aucune norme de l'industrie pour les formats de données de marché. Chaque échange a son format propriétaire. Les fournisseurs de contenu financier tels que Reuters et Bloomberg regroupent différentes sources de données de marché, la normalisent et ajoutent des nouvelles ou des analyses. Des exemples d'alimentations consolidées sont RDF (Reuters Data Feed), RWF (Reuters Wire Format) et Bloomberg Professional Services Data. Les deux vendeurs ont publié des données de marché en temps réel qui sont moins traitées et moins analysées: Bloomberg B-Pipe Avec B-Pipe, Bloomberg désaccouple leur flux de données de marché de leur plate-forme de distribution parce qu'un terminal Bloomberg N'est pas nécessaire pour obtenir B-Pipe. Wombat et Reuters Feed Handlers ont annoncé leur soutien à B-Pipe. Une entreprise peut décider de recevoir des aliments directement à partir d'un échange pour réduire la latence. Les gains de vitesse de transmission peuvent être compris entre 150 millisecondes et 500 millisecondes. Ces aliments sont plus complexes et plus coûteux et l'entreprise doit construire et entretenir sa propre usine de ticker (financetechfeaturedshowArticle. jhtmlarticleID60404306). Commandes de transaction Ce type de trafic porte les métiers réels. Il est bidirectionnel et très sensible à la latence. Il est mesuré en messagessec. Et Mbps. Les ordres proviennent d'un côté d'achat ou d'une firme de côté de vente et sont envoyés à des lieux de négociation comme un échange ou ECN pour l'exécution. Le format le plus courant pour le transport d'ordres est FIX (Financial Information eXchangefixprotocol. org). Les applications qui gèrent les messages FIX sont appelées moteurs FIX et elles interfèrent avec les systèmes de gestion des commandes (OMS). Une optimisation de FIX est appelée FAST (Fix Adapted for Streaming), qui utilise un schéma de compression pour réduire la longueur du message et, en effet, réduire la latence. FAST s'adresse davantage à la fourniture de données de marché et a le potentiel de devenir une norme. FAST peut également être utilisé comme un schéma de compression pour les formats de données de marché propriétaires. Pour réduire la latence, les entreprises peuvent choisir d'établir un accès direct au marché (DMA). DMA est le processus automatisé de routage d'une commande de titres directement à un lieu d'exécution, évitant ainsi l'intervention d'un tiers (towergroupresearchcontentglossary. jsppage1ampglossaryId383). DMA nécessite une connexion directe au lieu d'exécution. Le bus de messagerie est un logiciel middleware de fournisseurs tels que Tibco, 29West, Reuters RMDS ou une plateforme open source telle que AMQP. Le bus de messagerie utilise un mécanisme fiable pour fournir des messages. Le transport peut se faire sur TCPIP (TibcoEMS, 29West, RMDS et AMQP) ou UDPmulticast (TibcoRV, 29West et RMDS). Un concept important dans la distribution des messages est le flux quottopique, qui est un sous-ensemble de données de marché définies par des critères tels que le symbole boursier, l'industrie ou un certain panier d'instruments financiers. Les abonnés rejoignent des groupes de sujets mappés sur un ou plusieurs sous-thèmes afin de ne recevoir que les informations pertinentes. Dans le passé, tous les commerçants ont reçu toutes les données du marché. Aux volumes actuels de trafic, ceci serait sous-optimal. Le réseau joue un rôle essentiel dans l'environnement commercial. Les données de marché sont acheminées vers le marché où les commerçants humains sont situés via un réseau de grande vitesse du campus ou de la région métropolitaine. La haute disponibilité et la faible latence, ainsi que le haut débit, sont les métriques les plus importantes. L'environnement commercial hautement performant possède la plupart de ses composants dans la batterie de serveurs du centre de données. Pour minimiser la latence, les moteurs de négoce algorithmique doivent être situés à proximité des gestionnaires de flux, des moteurs FIX et des systèmes de gestion des commandes. Un modèle de déploiement alternatif a les systèmes de négociation algorithmique situés à un échange ou un fournisseur de services avec une connectivité rapide à des échanges multiples. Modèles de déploiement Il existe deux modèles de déploiement pour une plate-forme de négociation haute performance. Les entreprises peuvent choisir d'avoir un mélange des deux: Data Center de l'entreprise de négoce (Figure 2) C'est le modèle traditionnel, où une plate-forme de négociation à part entière est développé et maintenu par l'entreprise avec des liens de communication à tous les sites de négociation. La latence varie en fonction de la vitesse des liens et du nombre de bonds entre l'entreprise et les sites. Figure 2 Modèle de déploiement traditionnel Co-implantation sur le lieu de négociation (échanges, fournisseurs de services financiers (FSP)) (Figure 3) La société de négoce déploie sa plate-forme de négociation automatisée le plus près possible des sites d'exécution pour minimiser la latence. Figure 3 Modèle de déploiement hébergé Architecture commerciale orientée services Nous proposons un cadre orienté services pour la construction de l'architecture commerciale de la prochaine génération. Cette approche fournit un cadre conceptuel et un chemin d'implémentation basé sur la modularisation et la minimisation des inter-dépendances. Ce cadre fournit aux entreprises une méthodologie pour: Évaluer leur état actuel en termes de services Donner la priorité aux services en fonction de leur valeur pour l'entreprise Développer la plate-forme de négociation à l'état souhaité en utilisant une approche modulaire L'architecture de négociation haute performance repose sur les services suivants, Définie par le cadre d'architecture des services représenté à la figure 4. Figure 4 Architecture de service Architecture pour le service de messagerie haute latence ultra-faible Service Ce service est fourni par le bus de messagerie, qui est un système logiciel qui résout le problème de connexion many - Nombreuses applications. Le système se compose de: Un ensemble de schémas de messages prédéfinis Un ensemble de messages de commande communs Une infrastructure d'application partagée pour envoyer les messages aux destinataires. L'infrastructure partagée peut être basée sur un courtier de messages ou sur un modèle publishsubscribe. Les principales exigences pour le bus de messagerie de la prochaine génération sont (source 29West): La plus faible latence possible (par exemple moins de 100 microsecondes) Stabilité sous charge lourde (par exemple plus de 1,4 million de msgs) Contrôle et flexibilité (contrôle de débit et transports configurables) Sont des efforts dans l'industrie pour normaliser le bus de messagerie. Advanced Message Queuing Protocol (AMQP) est un exemple d'un standard ouvert défendu par J. P. Morgan Chase et soutenu par un groupe de fournisseurs tels que Cisco, Envoy Technologies, Red Hat, TWIST Process Innovations, Iona, 29West et iMatix. Deux des principaux objectifs sont de fournir un chemin plus simple à l'interopérabilité pour les applications écrites sur différentes plates-formes et la modularité de sorte que le middleware peut être facilement évolué. En termes très généraux, un serveur AMQP est analogue à un serveur de courrier électronique, chaque échange agissant comme un agent de transfert de messages et chaque file d'attente de messages comme une boîte aux lettres. Les liaisons définissent les tables de routage dans chaque agent de transfert. Les éditeurs envoient des messages à des agents de transfert individuels, qui acheminent ensuite les messages dans des boîtes aux lettres. Les consommateurs prennent les messages des boîtes aux lettres, ce qui crée un modèle puissant et flexible qui est simple (source: amqp. orgtikiwikitiki-index. phppageOpenApproachWhyAMQP). Latence Monitoring Service Les principales exigences de ce service sont: Granularité sous-milliseconde des mesures Visibilité quasi-temps réel sans ajout de latence au trafic commercial Capacité de différencier la latence du traitement des applications de la latence du réseau Capacité de gérer les taux de messages élevés Fournir une interface programmatique pour Les applications de négociation pour recevoir des données de latence, ce qui permet aux moteurs de négociation algorithmique de s'adapter aux conditions changeantes Corréler les événements de réseau avec les événements d'application à des fins de dépannage La latence peut être définie comme l'intervalle de temps entre un ordre commercial et quand le même ordre est reconnu et agi Par la partie destinataire. Aborder la question de la latence est un problème complexe, exigeant une approche holistique qui identifie toutes les sources de latence et applique différentes technologies à différentes couches du système. La figure 5 représente la variété de composants qui peuvent introduire une latence à chaque couche de la pile OSI. Il mappe également chaque source de latence avec une solution possible et une solution de surveillance. Cette approche stratifiée peut donner aux entreprises un moyen plus structuré d'attaquer le problème de latence, chaque composant pouvant être considéré comme un service et traité de manière cohérente dans l'entreprise. Le maintien d'une mesure précise de l'état dynamique de cet intervalle de temps sur des itinéraires et destinations alternatifs peut être d'une grande aide dans les décisions commerciales tactiques. La capacité d'identifier l'emplacement exact des retards, que ce soit dans le réseau périphérique des clients, le concentrateur de traitement central ou le niveau d'application de transaction, détermine de façon significative la capacité des fournisseurs de services à respecter leurs ententes de niveau de service de négociation (SLA). Pour les formulaires d'achat et de vente, ainsi que pour les syndicateurs de données de marché, l'identification rapide et l'élimination des goulets d'étranglement se traduisent directement par des opportunités commerciales accrues et des revenus. Figure 5 Architecture de gestion de latence Outils de surveillance de faible latence de Cisco Les outils de surveillance de réseau traditionnels fonctionnent avec des minutes ou des secondes de granularité. Les plates-formes de négociation de la prochaine génération, en particulier celles qui supportent le trading algorithmique, nécessitent des latences inférieures à 5 ms et des niveaux extrêmement faibles de perte de paquets. Sur un réseau local Gigabit, une microburst de 100 ms peut entraîner la perte ou le retard excessif de 10 000 transactions. Cisco offre à ses clients un choix d'outils pour mesurer la latence dans un environnement commercial: Gestionnaire de la qualité de bande passante (BQM) (OEM de Corvil) Un produit de gestion de la performance des applications réseau de nouvelle génération qui permet aux clients de surveiller et de fournir à leur réseau des niveaux contrôlés de latence et de performances de perte. Bien que BQM ne soit pas exclusivement ciblé sur les réseaux commerciaux, sa visibilité en microseconde combinée à des fonctions intelligentes de provisionnement de bande passante en font un outil idéal pour ces environnements exigeants. Cisco BQM 4.0 met en œuvre un large ensemble de technologies de mesure du trafic et d'analyse de réseau brevetées et en instance de brevet qui donnent à l'utilisateur une visibilité et une compréhension sans précédent de la façon d'optimiser le réseau pour une performance maximale des applications. Cisco BQM est désormais pris en charge par la famille de produits Cisco Application Deployment Engine (ADE). La gamme de produits Cisco ADE est la plate-forme de choix pour les applications de gestion de réseau Cisco. BQM Avantages La micro-visibilité Cisco BQM est la capacité de détecter, mesurer et analyser la latence, la gigue et la perte induisant des événements de trafic jusqu'à des niveaux de microseconde de granularité avec une résolution par paquet. Cela permet à Cisco BQM de détecter et de déterminer l'impact des événements de trafic sur la latence du réseau, la gigue et la perte. Le plus important pour les environnements de négociation est que BQM peut prendre en charge les mesures de latence, de perte et de gigue unidirectionnelles pour le trafic TCP et UDP (multicast). Cela signifie qu'il rend compte de manière transparente pour le trafic commercial et les flux de données du marché. BQM permet à l'utilisateur de spécifier un ensemble complet de seuils (contre l'activité microburst, latence, perte, gigue, utilisation, etc.) sur toutes les interfaces. BQM exploite alors une capture de paquets de roulage de fond. Chaque fois qu'une violation de seuil ou un autre événement de dégradation de performance potentiel se produit, il déclenche Cisco BQM pour stocker la capture de paquets sur le disque pour une analyse ultérieure. Cela permet à l'utilisateur d'examiner en détail le trafic d'application qui a été affecté par la dégradation des performances (quotthe victimes) et le trafic qui a causé la dégradation des performances (quotthe culpritsquot). Cela peut considérablement réduire le temps passé à diagnostiquer et à résoudre les problèmes de performances réseau. BQM est également en mesure de fournir des recommandations détaillées sur la fourniture de la bande passante et de la qualité de service (QoS), que l'utilisateur peut appliquer directement pour obtenir les performances réseau souhaitées. Mesures BQM illustrées Pour comprendre la différence entre certaines des techniques de mesure les plus conventionnelles et la visibilité fournie par BQM, nous pouvons examiner certains graphiques de comparaison. Dans le premier ensemble de graphiques (Figure 6 et Figure 7), nous voyons la différence entre la latence mesurée par le BQMs Passive Network Quality Monitor (PNQM) et la latence mesurée en injectant des paquets ping toutes les 1 seconde dans le flux de trafic. Dans la figure 6, nous voyons la latence signalée par des paquets de ping ICMP d'une seconde pour le trafic réseau réel (elle est divisée par 2 pour donner une estimation du délai unidirectionnel). Il montre le retard confortablement au-dessous d'environ 5 ms pour presque tout le temps. Figure 6 Latence signalée par des paquets de ping ICMP de 1 seconde pour le trafic réseau réel La figure 7 montre la latence signalée par PNQM pour le même trafic en même temps. Ici, nous voyons que, en mesurant la latence unidirectionnelle des paquets d'application réelle, nous obtenons une image radicalement différente. Ici, la latence est observée autour de 20 ms, avec des éclats occasionnels bien plus élevés. L'explication est que parce que ping est envoyer des paquets seulement chaque seconde, il est complètement absent la plupart de la latence du trafic d'application. En fait, les résultats de ping indiquent généralement un délai de propagation aller-retour plutôt qu'une latence d'application réaliste sur le réseau. Figure 7 Latence signalée par PNQM pour le trafic réseau réel Dans le deuxième exemple (Figure 8), nous voyons la différence entre les niveaux de charge ou de saturation des liens signalés entre une vue moyenne de 5 minutes et une vue de microburst de 5 ms (BQM peut signaler des microbursts vers le bas À environ 10 à 100 nanosecondes de précision). La ligne verte indique que l'utilisation moyenne à des moyennes de 5 minutes est faible, peut-être jusqu'à 5 Mbits. Le tracé bleu foncé montre l'activité microburst de 5 ms atteignant entre 75 Mbits et 100 Mbits, la vitesse du LAN efficacement. BQM montre ce niveau de granularité pour toutes les applications et il fournit également des règles de provisionnement claires pour permettre à l'utilisateur de contrôler ou de neutraliser ces micro-rafales. Figure 8 Différence de la charge de lien rapportée entre une vue moyenne de 5 minutes et une vue de microburst de 5 ms Déploiement de BQM dans le réseau de négociation La figure 9 montre un déploiement de BQM typique dans un réseau de négociation. Figure 9 Déploiement typique de BQM dans un réseau commercial BQM peut alors être utilisé pour répondre à ces types de questions: Est-ce que l'un de mes liens de réseau local Gigabit saturé pendant plus de X millisecondes est-ce causant la perte Quels liaisons bénéficieront le plus d'une mise à niveau vers Etherchannel ou 10 Gigabit Vitesses Quelle application du trafic provoque la saturation de mes 1 Gigabit liens Est-ce que l'une des données du marché subissant une perte de bout en bout Quelle latence supplémentaire fait l'expérience de centre de données de basculement Ce lien est-il correctement dimensionné pour faire face à microbursts Mes commerçants Obtenir des mises à jour de faible latence de la couche de distribution de données du marché Sont-ils voir des retards de plus de X millisecondes Être capable de répondre à ces questions simplement et efficacement économise du temps et de l'argent dans le fonctionnement du réseau commercial. BQM est un outil essentiel pour gagner en visibilité sur les données de marché et les environnements commerciaux. Il fournit des mesures granulaires de latence de bout en bout dans des infrastructures complexes qui subissent des mouvements de données à fort volume. La détection efficace des micro-rafales dans les niveaux inférieurs à la milliseconde et la réception d'analyses d'experts sur un événement particulier sont d'une valeur inestimable pour les architectes. Les recommandations relatives à la répartition intelligente de la bande passante, telles que le dimensionnement et l'analyse de simulation, fournissent une plus grande agilité pour répondre aux conditions de marché volatiles. Au fur et à mesure que l'explosion du trading algorithmique et l'augmentation des taux de messages se poursuivent, BQM, combiné à son outil QoS, offre la possibilité de mettre en œuvre des politiques QoS qui peuvent protéger les applications commerciales critiques. Solution de surveillance de la latence des services financiers de Cisco Cisco et Trading Metrics ont collaboré à des solutions de surveillance de la latence pour le flux d'ordres FIX et la surveillance des données du marché. Cisco AON technology is the foundation for a new class of network-embedded products and solutions that help merge intelligent networks with application infrastructure, based on either service-oriented or traditional architectures. Trading Metrics is a leading provider of analytics software for network infrastructure and application latency monitoring purposes (tradingmetrics ). The Cisco AON Financial Services Latency Monitoring Solution (FSMS) correlated two kinds of events at the point of observation: Network events correlated directly with coincident application message handling Trade order flow and matching market update events Using time stamps asserted at the point of capture in the network, real-time analysis of these correlated data streams permits precise identification of bottlenecks across the infrastructure while a trade is being executed or market data is being distributed. By monitoring and measuring latency early in the cycle, financial companies can make better decisions about which network serviceand which intermediary, market, or counterpartyto select for routing trade orders. Likewise, this knowledge allows more streamlined access to updated market data (stock quotes, economic news, etc.), which is an important basis for initiating, withdrawing from, or pursuing market opportunities. The components of the solution are: AON hardware in three form factors: AON Network Module for Cisco 2600280037003800 routers AON Blade for the Cisco Catalyst 6500 series AON 8340 Appliance Trading Metrics MampA 2.0 software, which provides the monitoring and alerting application, displays latency graphs on a dashboard, and issues alerts when slowdowns occur (tradingmetricsTMbrochure. pdf ). Figure 10 AON-Based FIX Latency Monitoring Cisco IP SLA Cisco IP SLA is an embedded network management tool in Cisco IOS which allows routers and switches to generate synthetic traffic streams which can be measured for latency, jitter, packet loss, and other criteria (ciscogoipsla ). Two key concepts are the source of the generated traffic and the target. Both of these run an IP SLA quotresponder, quot which has the responsibility to timestamp the control traffic before it is sourced and returned by the target (for a round trip measurement). Various traffic types can be sourced within IP SLA and they are aimed at different metrics and target different services and applications. The UDP jitter operation is used to measure one-way and round-trip delay and report variations. As the traffic is time stamped on both sending and target devices using the responder capability, the round trip delay is characterized as the delta between the two timestamps. A new feature was introduced in IOS 12.3(14)T, IP SLA Sub Millisecond Reporting, which allows for timestamps to be displayed with a resolution in microseconds, thus providing a level of granularity not previously available. This new feature has now made IP SLA relevant to campus networks where network latency is typically in the range of 300-800 microseconds and the ability to detect trends and spikes (brief trends) based on microsecond granularity counters is a requirement for customers engaged in time-sensitive electronic trading environments. As a result, IP SLA is now being considered by significant numbers of financial organizations as they are all faced with requirements to: Report baseline latency to their users Trend baseline latency over time Respond quickly to traffic bursts that cause changes in the reported latency Sub-millisecond reporting is necessary for these customers, since many campus and backbones are currently delivering under a second of latency across several switch hops. Electronic trading environments have generally worked to eliminate or minimize all areas of device and network latency to deliver rapid order fulfillment to the business. Reporting that network response times are quotjust under one millisecondquot is no longer sufficient the granularity of latency measurements reported across a network segment or backbone need to be closer to 300-800 micro-seconds with a degree of resolution of 100 igrave seconds. IP SLA recently added support for IP multicast test streams, which can measure market data latency. A typical network topology is shown in Figure 11 with the IP SLA shadow routers, sources, and responders. Figure 11 IP SLA Deployment Computing Services Computing services cover a wide range of technologies with the goal of eliminating memory and CPU bottlenecks created by the processing of network packets. Trading applications consume high volumes of market data and the servers have to dedicate resources to processing network traffic instead of application processing. Transport processingAt high speeds, network packet processing can consume a significant amount of server CPU cycles and memory. An established rule of thumb states that 1Gbps of network bandwidth requires 1 GHz of processor capacity (source Intel white paper on IO acceleration inteltechnologyioacceleration306517.pdf ). Intermediate buffer copyingIn a conventional network stack implementation, data needs to be copied by the CPU between network buffers and application buffers. This overhead is worsened by the fact that memory speeds have not kept up with increases in CPU speeds. For example, processors like the Intel Xeon are approaching 4 GHz, while RAM chips hover around 400MHz (for DDR 3200 memory) (source Intel inteltechnologyioacceleration306517.pdf ). Context switchingEvery time an individual packet needs to be processed, the CPU performs a context switch from application context to network traffic context. This overhead could be reduced if the switch would occur only when the whole application buffer is complete. Figure 12 Sources of Overhead in Data Center Servers TCP Offload Engine (TOE)Offloads transport processor cycles to the NIC. Moves TCPIP protocol stack buffer copies from system memory to NIC memory. Remote Direct Memory Access (RDMA)Enables a network adapter to transfer data directly from application to application without involving the operating system. Eliminates intermediate and application buffer copies (memory bandwidth consumption). Kernel bypass Direct user-level access to hardware. Dramatically reduces application context switches. Figure 13 RDMA and Kernel Bypass InfiniBand is a point-to-point (switched fabric) bidirectional serial communication link which implements RDMA, among other features. Cisco offers an InfiniBand switch, the Server Fabric Switch (SFS): ciscoapplicationpdfenusguestnetsolns500c643cdccont0900aecd804c35cb. pdf. Figure 14 Typical SFS Deployment Trading applications benefit from the reduction in latency and latency variability, as proved by a test performed with the Cisco SFS and Wombat Feed Handlers by Stac Research: Application Virtualization Service De-coupling the application from the underlying OS and server hardware enables them to run as network services. One application can be run in parallel on multiple servers, or multiple applications can be run on the same server, as the best resource allocation dictates. This decoupling enables better load balancing and disaster recovery for business continuance strategies. The process of re-allocating computing resources to an application is dynamic. Using an application virtualization system like Data Synapses GridServer, applications can migrate, using pre-configured policies, to under-utilized servers in a supply-matches-demand process (networkworldsupp2005ndc1022105virtual. htmlpage2 ). There are many business advantages for financial firms who adopt application virtualization: Faster time to market for new products and services Faster integration of firms following merger and acquisition activity Increased application availability Better workload distribution, which creates more quothead roomquot for processing spikes in trading volume Operational efficiency and control Reduction in IT complexity Currently, application virtualization is not used in the trading front-office. One use-case is risk modeling, like Monte Carlo simulations. As the technology evolves, it is conceivable that some the trading platforms will adopt it. Data Virtualization Service To effectively share resources across distributed enterprise applications, firms must be able to leverage data across multiple sources in real-time while ensuring data integrity. With solutions from data virtualization software vendors such as Gemstone or Tangosol (now Oracle), financial firms can access heterogeneous sources of data as a single system image that enables connectivity between business processes and unrestrained application access to distributed caching. The net result is that all users have instant access to these data resources across a distributed network (gridtoday030210101061.html ). This is called a data grid and is the first step in the process of creating what Gartner calls Extreme Transaction Processing (XTP) (gartnerDisplayDocumentrefgsearchampid500947 ). Technologies such as data and applications virtualization enable financial firms to perform real-time complex analytics, event-driven applications, and dynamic resource allocation. One example of data virtualization in action is a global order book application. An order book is the repository of active orders that is published by the exchange or other market makers. A global order book aggregates orders from around the world from markets that operate independently. The biggest challenge for the application is scalability over WAN connectivity because it has to maintain state. Todays data grids are localized in data centers connected by Metro Area Networks (MAN). This is mainly because the applications themselves have limitsthey have been developed without the WAN in mind. Figure 15 GemStone GemFire Distributed Caching Before data virtualization, applications used database clustering for failover and scalability. This solution is limited by the performance of the underlying database. Failover is slower because the data is committed to disc. With data grids, the data which is part of the active state is cached in memory, which reduces drastically the failover time. Scaling the data grid means just adding more distributed resources, providing a more deterministic performance compared to a database cluster. Multicast Service Market data delivery is a perfect example of an application that needs to deliver the same data stream to hundreds and potentially thousands of end users. Market data services have been implemented with TCP or UDP broadcast as the network layer, but those implementations have limited scalability. Using TCP requires a separate socket and sliding window on the server for each recipient. UDP broadcast requires a separate copy of the stream for each destination subnet. Both of these methods exhaust the resources of the servers and the network. The server side must transmit and service each of the streams individually, which requires larger and larger server farms. On the network side, the required bandwidth for the application increases in a linear fashion. For example, to send a 1 Mbps stream to 1000recipients using TCP requires 1 Gbps of bandwidth. IP multicast is the only way to scale market data delivery. To deliver a 1 Mbps stream to 1000 recipients, IP multicast would require 1 Mbps. The stream can be delivered by as few as two serversone primary and one backup for redundancy. There are two main phases of market data delivery to the end user. In the first phase, the data stream must be brought from the exchange into the brokerages network. Typically the feeds are terminated in a data center on the customer premise. The feeds are then processed by a feed handler, which may normalize the data stream into a common format and then republish into the application messaging servers in the data center. The second phase involves injecting the data stream into the application messaging bus which feeds the core infrastructure of the trading applications. The large brokerage houses have thousands of applications that use the market data streams for various purposes, such as live trades, long term trending, arbitrage, etc. Many of these applications listen to the feeds and then republish their own analytical and derivative information. For example, a brokerage may compare the prices of CSCO to the option prices of CSCO on another exchange and then publish ratings which a different application may monitor to determine how much they are out of synchronization. Figure 16 Market Data Distribution Players The delivery of these data streams is typically over a reliable multicast transport protocol, traditionally Tibco Rendezvous. Tibco RV operates in a publish and subscribe environment. Each financial instrument is given a subject name, such as CSCO. last. Each application server can request the individual instruments of interest by their subject name and receive just a that subset of the information. This is called subject-based forwarding or filtering. Subject-based filtering is patented by Tibco. A distinction should be made between the first and second phases of market data delivery. The delivery of market data from the exchange to the brokerage is mostly a one-to-many application. The only exception to the unidirectional nature of market data may be retransmission requests, which are usually sent using unicast. The trading applications, however, are definitely many-to-many applications and may interact with the exchanges to place orders. Figure 17 Market Data Architecture Design Issues Number of GroupsChannels to Use Many application developers consider using thousand of multicast groups to give them the ability to divide up products or instruments into small buckets. Normally these applications send many small messages as part of their information bus. Usually several messages are sent in each packet that are received by many users. Sending fewer messages in each packet increases the overhead necessary for each message. In the extreme case, sending only one message in each packet quickly reaches the point of diminishing returnsthere is more overhead sent than actual data. Application developers must find a reasonable compromise between the number of groups and breaking up their products into logical buckets. Consider, for example, the Nasdaq Quotation Dissemination Service (NQDS). The instruments are broken up alphabetically: This approach allows for straight forward networkapplication management, but does not necessarily allow for optimized bandwidth utilization for most users. A user of NQDS that is interested in technology stocks, and would like to subscribe to just CSCO and INTL, would have to pull down all the data for the first two groups of NQDS. Understanding the way users pull down the data and then organize it into appropriate logical groups optimizes the bandwidth for each user. In many market data applications, optimizing the data organization would be of limited value. Typically customers bring in all data into a few machines and filter the instruments. Using more groups is just more overhead for the stack and does not help the customers conserve bandwidth. Another approach might be to keep the groups down to a minimum level and use UDP port numbers to further differentiate if necessary. The other extreme would be to use just one multicast group for the entire application and then have the end user filter the data. In some situations this may be sufficient. Intermittent Sources A common issue with market data applications are servers that send data to a multicast group and then go silent for more than 3.5 minutes. These intermittent sources may cause trashing of state on the network and can introduce packet loss during the window of time when soft state and then hardware shorts are being created. PIM-Bidir or PIM-SSM The first and best solution for intermittent sources is to use PIM-Bidir for many-to-many applications and PIM-SSM for one-to-many applications. Both of these optimizations of the PIM protocol do not have any data-driven events in creating forwarding state. That means that as long as the receivers are subscribed to the streams, the network has the forwarding state created in the hardware switching path. Intermittent sources are not an issue with PIM-Bidir and PIM-SSM. Null Packets In PIM-SM environments a common method to make sure forwarding state is created is to send a burst of null packets to the multicast group before the actual data stream. The application must efficiently ignore these null data packets to ensure it does not affect performance. The sources must only send the burst of packets if they have been silent for more than 3 minutes. A good practice is to send the burst if the source is silent for more than a minute. Many financials send out an initial burst of traffic in the morning and then all well-behaved sources do not have problems. Periodic Keepalives or Heartbeats An alternative approach for PIM-SM environments is for sources to send periodic heartbeat messages to the multicast groups. This is a similar approach to the null packets, but the packets can be sent on a regular timer so that the forwarding state never expires. S, G Expiry Timer Finally, Cisco has made a modification to the operation of the S, G expiry timer in IOS. There is now a CLI knob to allow the state for a S, G to stay alive for hours without any traffic being sent. The (S, G) expiry timer is configurable. This approach should be considered a workaround until PIM-Bidir or PIM-SSM is deployed or the application is fixed. RTCP Feedback A common issue with real time voice and video applications that use RTP is the use of RTCP feedback traffic. Unnecessary use of the feedback option can create excessive multicast state in the network. If the RTCP traffic is not required by the application it should be avoided. Fast Producers and Slow Consumers Today many servers providing market data are attached at Gigabit speeds, while the receivers are attached at different speeds, usually 100Mbps. This creates the potential for receivers to drop packets and request re-transmissions, which creates more traffic that the slowest consumers cannot handle, continuing the vicious circle. The solution needs to be some type of access control in the application that limits the amount of data that one host can request. QoS and other network functions can mitigate the problem, but ultimately the subscriptions need to be managed in the application. Tibco Heartbeats TibcoRV has had the ability to use IP multicast for the heartbeat between the TICs for many years. However, there are some brokerage houses that are still using very old versions of TibcoRV that use UDP broadcast support for the resiliency. This limitation is often cited as a reason to maintain a Layer 2 infrastructure between TICs located in different data centers. These older versions of TibcoRV should be phased out in favor of the IP multicast supported versions. Multicast Forwarding Options PIM Sparse Mode The standard IP multicast forwarding protocol used today for market data delivery is PIM Sparse Mode. It is supported on all Cisco routers and switches and is well understood. PIM-SM can be used in all the network components from the exchange, FSP, and brokerage. There are, however, some long-standing issues and unnecessary complexity associated with a PIM-SM deployment that could be avoided by using PIM-Bidir and PIM-SSM. These are covered in the next sections. The main components of the PIM-SM implementation are: PIM Sparse Mode v2 Shared Tree (spt-threshold infinity) A design option in the brokerage or in the exchange. Energy Trading System tools Access tools, manuals, and key trading information for market participants The Energy Trading System (ETS) is used to participate in the wholesale energy market. Market participants use ETS to enter energy supply offers and demand bids. The system also includes metering data, settlement and billing. Accessing ETS Participants are required to apply for and receive a digital certificate to gain access to the confidential information residing on the ETS. A digital certificate assures that the website you access is the secure AESO ETS. It also allows the ETS to recognize authorized system users and allow access to appropriate information. For security integrity, certificates require renewal on or before the anniversary date of the installation. Symantec VeriSign will automatically notify you one month prior to the annual renewal date. For fast facts on digital certificates, the application form, and instructions on applying, renewing, importingexporting, and troubleshooting digital certificates, read the following documents. ETS manuals These participant manuals provide step-by-step instructions for navigating the ETS. Read instructions for entering offers for energy, net settlement instructions and submitting offers as an importexport participant here: File upload examples and templates Download templates and examples to help you submit or restate an energy offer, submit or restate dispatch down service, operating reserves, or report an upcoming outage. Energy submission, restatement and historical offer control Dispatch Down Service (DDS) submission Outage scheduling amp load outage report forms Helpful tips: using acknowledgements for file upload Participants may use acknowledgements that they receive when restating through the ETS user-interface to perform a restatement file upload. Log in to the ETS and follow the steps below: 1. Submission - gt Energy Submission a. Select Restatement b. Edit Existing c. Todays date d. Source 2. Result tab select an asset for restatement 3. Data Entry tab click Submit button 4. An acknowledgement window pops up 5. Save the acknowledgement in a file (.txt or CSV) ETS training environment The ETS training environment gives new and existing pool participants the opportunity to practice transactions in a sandboxed environment. To access the ETS training environment. you need an ETS training digital certificate. Digital certificates cost 100 plus GST per certificate, per year. This cost will appear on your monthly pool statement. Read our procedures guide, with step by step instructions on how to complete the enrolment process, here: To request access to the ETS, email the application form above to ets. trainingaeso. ca . Marché
No comments:
Post a Comment