Una guida rapida per calcolare la matrice di correlazione in Python usando NSEpy e Pandas

Analisi dati excel (Luglio 2019).

Anonim

Ecco un breve tutorial in python per calcolare Matrix di correlazione tra più strumenti di borsa usando pacchetti Python come NSEpy e Pandas. Generalmente il coefficiente di correlazione è una misura statistica che riflette la correlazione tra due titoli / strumenti finanziari. Determinare la relazione tra due titoli è utile per analizzare relazioni intermarket, relazioni settore / azioni e relazioni settore / mercato.

Ecco alcune delle librerie Python essenziali richieste per la visualizzazione dei dati della matrice di correlazione

IPython (Interactive Python)
Pandas (libreria Python per gestire i dati delle serie temporali)
NSEpy (recupera dati storici da NSEindia - NSEpy 0.3 ver o superiore)
Matplotlib (libreria Python per gestire il disegno 2D)

Importa i moduli python richiesti

i) da nsepy.archives abbiamo bisogno di importare get_price_history: -per recuperare i dettagli del prezzo del titolo
ii) dall'importazione datetime è necessario importare l'oggetto data: - per indicare il limite di date per gli stock richiesti
iii) importazione di panda: - per la creazione di dataframe
iv) importare matplotlib per tracciare la heatmap di correlazione

Crea una lista di azioni

Scarica dati storici
Ora recupera la cronologia dei prezzi di ogni stock in base a un limite di tempo specifico e aggiungendo l'ultimo valore di chiusura in un dataframe panda vuoto

Calcola e matrice di correlazione della trama
Calcola ora la variazione percentuale e la correlazione di Pearson usando le funzioni pandas dataframe pct_change (), corr () e traccia la matrice di correlazione usando
matplotlib come mostrato di seguito.

Nota: % pylab inline viene utilizzato come variabile di visualizzazione sul blocco note di ipython.

Esempio di Notebook IPython per generare la Mappa matrice di correlazione delle scorte come mostrato di seguito: