Régression inverse par tranches sur flux de données

2012 
Dans cette communication, nous nous concentrons sur des donnees arrivant sequentiellement par bloc. Nous supposons la presence d'un modele semi-parametrique sous-jacent incluant une direction EDR (Effective Dimension Reduction) commune dans chaque bloc. Nous proposons une approche SIR (Sliced Inverse Regression pour regression inverse par tranches) adaptative afin d'estimer b. L'estimateur propose est plus rapide qu'une application sequentielle de la methode SIR a l'union des blocs disponibles. Nous montrons la convergence en probabilite et la normalite asymptotique de cet estimateur. Dans une simulation, nous illustrons le bon comportement numerique de notre approche. Nous fournissons egalement des graphiques permettant de detecter s'il existe une derive de la direction EDR ou bien des blocs de donnees aberrantes, et nous illustrons notre approche avec differents scenarios. Quelques extensions possibles de cette methode sont discutees en conclusion. / In this communication, we consider block-wise evolving data streams. When a semiparametric regression model involving a common dimension reduction direction is assumed for each block, we propose an adaptive SIR (Sliced Inverse Regression) estimator of B. This estimator is faster than usual SIR applied to the union of all the blocks, both from computational complexity and running time points of view. We show the consistency of our estimator at the root-n rate and give its asymptotic distribution. In a simulation study, we illustrate the good numerical behavior of the estimator. We also provide a graphical tool in order to detect if there exists a drift of the dimension reduction direction or some aberrant blocks of data. We illustrate our approach with various scenarios. Finally, possible extensions of this method are given.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    2
    Citations
    NaN
    KQI
    []