update

06b1825d · joshuaroschlaub · a308f7b0 · 06b1825d · 06b1825d · 06b1825d
Commit 06b1825d authored Nov 13, 2021 by joshuaroschlaub
--- a/notebooks/digit_recognizer.ipynb
+++ b/notebooks/digit_recognizer.ipynb
--- a/notebooks/spectral_classifier_big/.ipynb_checkpoints/fits_to_npy-checkpoint.ipynb
+++ b/notebooks/spectral_classifier_big/.ipynb_checkpoints/fits_to_npy-checkpoint.ipynb
+{
+ "cells": [],
+ "metadata": {},
+ "nbformat": 4,
+ "nbformat_minor": 5
+}
--- a/notebooks/spectral_classifier_big/.ipynb_checkpoints/spectral_classifier_from_npy-checkpoint.ipynb
+++ b/notebooks/spectral_classifier_big/.ipynb_checkpoints/spectral_classifier_from_npy-checkpoint.ipynb
--- a/notebooks/spectral_classifier_big/accuracy_graph_v2.png
+++ b/notebooks/spectral_classifier_big/accuracy_graph_v2.png
--- a/notebooks/spectral_classifier_big/fits_to_csv.ipynb
+++ b/notebooks/spectral_classifier_big/fits_to_csv.ipynb
@@ -144,7 +144,7 @@
    "    print(str(count_failed/11000*100) + \"% waren nicht erfolgreich bei der Klasse:\" + directory)\n",
    "    print(str(count_added) + \" CSV-Dateien angelegt.\")\n",
    "    \n",
-    "# csv-Datei erstellen und erste Zeile schreiben\n",
+    "# Liste mit Einträgen der ersten Zeile in der csv Datei erstellen\n",
    "row_labels = ['wavelength']\n",
    "for i in range(1000):\n",
    "    row_labels.append('AGN{} flux'.format(i+1))\n",

 %% Cell type:code id: tags:

 ``` python
 import numpy as np
 from astropy.io import fits
 import matplotlib.pyplot as plt
 from astropy.wcs import WCS
 import os
 import csv

 ########## Input ##########

 fits_path = 'F:\\data\\spectral_fits_big\\'
 data_path = 'F:\\data\\'

 samples_per_class = 10000

 smallest_wavelength = 4000 # in Angström
 biggest_wavelength = 9000

 ########## Program ##########


 # Funktion zum transponieren von Listen
 def transpose_list(list1):
    numpy_array = np.array(list1)
    transposed = numpy_array.T
    return transposed.tolist()


 # Über alle fits-Dateien iterieren
 all_flux = []

 for directory in os.listdir(fits_path):

    count_failed=0
    count_added=0

    for filename in os.listdir(fits_path + directory + '\\'):

        path = fits_path + '\\' + directory + '\\' + filename

        # fits-Dateien öffnen und wavelength + flux einlesen
        hdul = fits.open(path)
        data = hdul[1].data
        flux = data['flux']
        wavelength = 10**data['loglam']
        hdul.close()

        # first und last Index finden
        for i in range(len(wavelength)):
            if wavelength[i]>smallest_wavelength:
                first_index = i
                break

        for i in range(len(wavelength)):
            if wavelength[i]>biggest_wavelength:
                last_index = i
                break

        # wavenlength und flux Listen schneiden
        wavelength = wavelength[first_index:last_index]
        flux = flux[first_index:last_index]

        if len(wavelength) == 3522 and count_added < samples_per_class:
            all_flux.append(flux)
            count_added += 1

        if len(wavelength) != 3522:
            print("Länge der Liste wavelength ist: " + str(len(wavelength)))
            count_failed += 1

    print(str(count_failed/11000*100) + "% waren nicht erfolgreich bei der Klasse:" + directory)
    print(str(count_added) + " CSV-Dateien angelegt.")

-# csv-Datei erstellen und erste Zeile schreiben
+# Liste mit Einträgen der ersten Zeile in der csv Datei erstellen
 row_labels = ['wavelength']
 for i in range(1000):
    row_labels.append('AGN{} flux'.format(i+1))
 for i in range(1000):
    row_labels.append('galaxy{} flux'.format(i+1))
 for i in range(1000):
    row_labels.append('QSO{} flux'.format(i+1))
 for i in range(1000):
    row_labels.append('star{} flux'.format(i+1))

 # Daten in csv-Datei abspeichern
 file = open(data_path + 'spectral_data_big.csv', 'w')
 with file:
    writer = csv.writer(file, delimiter=',', lineterminator='\n')
    writer.writerow(row_labels)

    all_flux_transposed = transpose_list(all_flux)

    for i in range(len(all_flux_transposed)):
        writer.writerow([wavelength[i]] + all_flux_transposed[i])
 ```

 %% Output

    Länge der Liste wavelength ist: 3267
    Länge der Liste wavelength ist: 2690
    Länge der Liste wavelength ist: 3483
    Länge der Liste wavelength ist: 3521
    0.36363636363636365% waren nicht erfolgreich bei der Klasse:AGN
    1000 CSV-Dateien angelegt.
    Länge der Liste wavelength ist: 3521
    Länge der Liste wavelength ist: 3502
    Länge der Liste wavelength ist: 3511
    Länge der Liste wavelength ist: 3521
    Länge der Liste wavelength ist: 3493
    Länge der Liste wavelength ist: 3519
    Länge der Liste wavelength ist: 3506
    Länge der Liste wavelength ist: 3477
    Länge der Liste wavelength ist: 3487
    Länge der Liste wavelength ist: 3486
    Länge der Liste wavelength ist: 3503
    Länge der Liste wavelength ist: 3470
    Länge der Liste wavelength ist: 3513
    Länge der Liste wavelength ist: 3503
    Länge der Liste wavelength ist: 3470
    Länge der Liste wavelength ist: 3503
    Länge der Liste wavelength ist: 3467
    Länge der Liste wavelength ist: 3469
    Länge der Liste wavelength ist: 3494
    Länge der Liste wavelength ist: 3461
    Länge der Liste wavelength ist: 3423
    Länge der Liste wavelength ist: 3507
    Länge der Liste wavelength ist: 3433
    Länge der Liste wavelength ist: 3487
    Länge der Liste wavelength ist: 3484
    Länge der Liste wavelength ist: 3470
    Länge der Liste wavelength ist: 3469
    Länge der Liste wavelength ist: 3447
    Länge der Liste wavelength ist: 3447
    Länge der Liste wavelength ist: 3511
    2.727272727272727% waren nicht erfolgreich bei der Klasse:galaxy
    1000 CSV-Dateien angelegt.
    Länge der Liste wavelength ist: 3516
    Länge der Liste wavelength ist: 3495
    Länge der Liste wavelength ist: 3116
    0.27272727272727276% waren nicht erfolgreich bei der Klasse:QSO
    1000 CSV-Dateien angelegt.
    Länge der Liste wavelength ist: 3461
    Länge der Liste wavelength ist: 3472
    Länge der Liste wavelength ist: 3475
    Länge der Liste wavelength ist: 3468
    Länge der Liste wavelength ist: 3444
    Länge der Liste wavelength ist: 3469
    Länge der Liste wavelength ist: 3439
    Länge der Liste wavelength ist: 3459
    Länge der Liste wavelength ist: 3424
    Länge der Liste wavelength ist: 3431
    Länge der Liste wavelength ist: 3521
    Länge der Liste wavelength ist: 3441
    Länge der Liste wavelength ist: 3515
    Länge der Liste wavelength ist: 3237
    1.2727272727272727% waren nicht erfolgreich bei der Klasse:star
    1000 CSV-Dateien angelegt.

 %% Cell type:code id: tags:

 ``` python
 ```

--- a/notebooks/spectral_classifier_big/fits_to_npy.ipynb
+++ b/notebooks/spectral_classifier_big/fits_to_npy.ipynb
+{
+ "cells": [
+  {
+   "cell_type": "code",
+   "execution_count": 27,
+   "id": "6e2b226d",
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Länge der Liste wavelength ist: 3267\n",
+      "Länge der Liste wavelength ist: 2690\n",
+      "Länge der Liste wavelength ist: 3483\n",
+      "Länge der Liste wavelength ist: 3521\n",
+      "0.4% waren nicht erfolgreich bei der Klasse:AGN\n",
+      "Länge der Liste wavelength ist: 3521\n",
+      "Länge der Liste wavelength ist: 3502\n",
+      "Länge der Liste wavelength ist: 3511\n",
+      "Länge der Liste wavelength ist: 3521\n",
+      "Länge der Liste wavelength ist: 3493\n",
+      "Länge der Liste wavelength ist: 3519\n",
+      "Länge der Liste wavelength ist: 3506\n",
+      "Länge der Liste wavelength ist: 3477\n",
+      "Länge der Liste wavelength ist: 3487\n",
+      "Länge der Liste wavelength ist: 3486\n",
+      "Länge der Liste wavelength ist: 3503\n",
+      "Länge der Liste wavelength ist: 3470\n",
+      "Länge der Liste wavelength ist: 3513\n",
+      "Länge der Liste wavelength ist: 3503\n",
+      "Länge der Liste wavelength ist: 3470\n",
+      "Länge der Liste wavelength ist: 3503\n",
+      "Länge der Liste wavelength ist: 3467\n",
+      "Länge der Liste wavelength ist: 3469\n",
+      "Länge der Liste wavelength ist: 3494\n",
+      "Länge der Liste wavelength ist: 3461\n",
+      "Länge der Liste wavelength ist: 3423\n",
+      "Länge der Liste wavelength ist: 3507\n",
+      "Länge der Liste wavelength ist: 3433\n",
+      "Länge der Liste wavelength ist: 3487\n",
+      "Länge der Liste wavelength ist: 3484\n",
+      "Länge der Liste wavelength ist: 3470\n",
+      "Länge der Liste wavelength ist: 3469\n",
+      "Länge der Liste wavelength ist: 3447\n",
+      "Länge der Liste wavelength ist: 3447\n",
+      "Länge der Liste wavelength ist: 3511\n",
+      "3.0% waren nicht erfolgreich bei der Klasse:galaxy\n",
+      "Länge der Liste wavelength ist: 3516\n",
+      "Länge der Liste wavelength ist: 3495\n",
+      "Länge der Liste wavelength ist: 3116\n",
+      "0.3% waren nicht erfolgreich bei der Klasse:QSO\n",
+      "Länge der Liste wavelength ist: 3461\n",
+      "Länge der Liste wavelength ist: 3472\n",
+      "Länge der Liste wavelength ist: 3475\n",
+      "Länge der Liste wavelength ist: 3468\n",
+      "Länge der Liste wavelength ist: 3444\n",
+      "Länge der Liste wavelength ist: 3469\n",
+      "Länge der Liste wavelength ist: 3439\n",
+      "Länge der Liste wavelength ist: 3459\n",
+      "Länge der Liste wavelength ist: 3424\n",
+      "Länge der Liste wavelength ist: 3431\n",
+      "Länge der Liste wavelength ist: 3521\n",
+      "Länge der Liste wavelength ist: 3441\n",
+      "Länge der Liste wavelength ist: 3515\n",
+      "Länge der Liste wavelength ist: 3237\n",
+      "1.4000000000000001% waren nicht erfolgreich bei der Klasse:star\n"
+     ]
+    }
+   ],
+   "source": [
+    "import numpy as np\n",
+    "from astropy.io import fits\n",
+    "import matplotlib.pyplot as plt\n",
+    "from astropy.wcs import WCS\n",
+    "import os\n",
+    "import csv\n",
+    "\n",
+    "########## Input ##########\n",
+    "\n",
+    "fits_path = 'F:\\\\data\\\\spectral_fits\\\\'\n",
+    "data_path = 'F:\\\\data\\\\'\n",
+    "\n",
+    "samples_per_class = 1000\n",
+    "\n",
+    "smallest_wavelength = 4000 # in Angström\n",
+    "biggest_wavelength = 9000 \n",
+    "\n",
+    "########## Program ##########\n",
+    "\n",
+    "all_flux = []\n",
+    "\n",
+    "for directory in os.listdir(fits_path):\n",
+    "    \n",
+    "    count_failed=0\n",
+    "    count_added=0\n",
+    "    \n",
+    "    for filename in os.listdir(fits_path + directory + '\\\\'):\n",
+    "        \n",
+    "        path = fits_path + '\\\\' + directory + '\\\\' + filename\n",
+    "        \n",
+    "        # fits-Dateien öffnen und wavelength + flux einlesen\n",
+    "        hdul = fits.open(path)\n",
+    "        data = hdul[1].data\n",
+    "        flux = data['flux']\n",
+    "        wavelength = 10**data['loglam']\n",
+    "        hdul.close()\n",
+    "        \n",
+    "        # first und last Index finden\n",
+    "        for i in range(len(wavelength)):\n",
+    "            if wavelength[i]>smallest_wavelength:\n",
+    "                first_index = i\n",
+    "                break\n",
+    "\n",
+    "        for i in range(len(wavelength)):\n",
+    "            if wavelength[i]>biggest_wavelength:\n",
+    "                last_index = i\n",
+    "                break\n",
+    "\n",
+    "        # wavenlength und flux Listen schneiden\n",
+    "        wavelength = wavelength[first_index:last_index]\n",
+    "        flux = flux[first_index:last_index]\n",
+    "        \n",
+    "        if len(wavelength) == 3522 and count_added < samples_per_class:\n",
+    "            all_flux.append(flux) \n",
+    "            count_added += 1        \n",
+    "\n",
+    "        if len(wavelength) != 3522:\n",
+    "            print(\"Länge der Liste wavelength ist: \" + str(len(wavelength)))\n",
+    "            count_failed += 1            \n",
+    "            \n",
+    "    print(str(count_failed/1000*100) + \"% waren nicht erfolgreich bei der Klasse:\" + directory)\n",
+    "\n",
+    "# Numpy Arrays mit Daten füllen\n",
+    "data = np.array(all_flux)\n",
+    "\n",
+    "labels = np.zeros(shape=(4000,), dtype='int')\n",
+    "for i in range(4):\n",
+    "    for t in range(samples_per_class):\n",
+    "        labels[i*1000+t] = i\n",
+    "        \n",
+    "wavelengths = np.array(wavelength)\n",
+    "\n",
+    "# Numpy arrays in .npy Dateien speichern\n",
+    "np.save(data_path + \"data.npy\", data)\n",
+    "np.save(data_path + \"labels.npy\", labels)\n",
+    "np.save(data_path + \"wavelengths.npy\", wavelengths)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "85504e55",
+   "metadata": {},
+   "outputs": [],
+   "source": []
+  }
+ ],
+ "metadata": {
+  "kernelspec": {
+   "display_name": "Python 3 (ipykernel)",
+   "language": "python",
+   "name": "python3"
+  },
+  "language_info": {
+   "codemirror_mode": {
+    "name": "ipython",
+    "version": 3
+   },
+   "file_extension": ".py",
+   "mimetype": "text/x-python",
+   "name": "python",
+   "nbconvert_exporter": "python",
+   "pygments_lexer": "ipython3",
+   "version": "3.8.5"
+  }
+ },
+ "nbformat": 4,
+ "nbformat_minor": 5
+}
+%% Cell type:code id:6e2b226d tags:
+
+``` python
+import numpy as np
+from astropy.io import fits
+import matplotlib.pyplot as plt
+from astropy.wcs import WCS
+import os
+import csv
+
+########## Input ##########
+
+fits_path = 'F:\\data\\spectral_fits\\'
+data_path = 'F:\\data\\'
+
+samples_per_class = 1000
+
+smallest_wavelength = 4000 # in Angström
+biggest_wavelength = 9000
+
+########## Program ##########
+
+all_flux = []
+
+for directory in os.listdir(fits_path):
+
+    count_failed=0
+    count_added=0
+
+    for filename in os.listdir(fits_path + directory + '\\'):
+
+        path = fits_path + '\\' + directory + '\\' + filename
+
+        # fits-Dateien öffnen und wavelength + flux einlesen
+        hdul = fits.open(path)
+        data = hdul[1].data
+        flux = data['flux']
+        wavelength = 10**data['loglam']
+        hdul.close()
+
+        # first und last Index finden
+        for i in range(len(wavelength)):
+            if wavelength[i]>smallest_wavelength:
+                first_index = i
+                break
+
+        for i in range(len(wavelength)):
+            if wavelength[i]>biggest_wavelength:
+                last_index = i
+                break
+
+        # wavenlength und flux Listen schneiden
+        wavelength = wavelength[first_index:last_index]
+        flux = flux[first_index:last_index]
+
+        if len(wavelength) == 3522 and count_added < samples_per_class:
+            all_flux.append(flux)
+            count_added += 1
+
+        if len(wavelength) != 3522:
+            print("Länge der Liste wavelength ist: " + str(len(wavelength)))
+            count_failed += 1
+
+    print(str(count_failed/1000*100) + "% waren nicht erfolgreich bei der Klasse:" + directory)
+
+# Numpy Arrays mit Daten füllen
+data = np.array(all_flux)
+
+labels = np.zeros(shape=(4000,), dtype='int')
+for i in range(4):
+    for t in range(samples_per_class):
+        labels[i*1000+t] = i
+
+wavelengths = np.array(wavelength)
+
+# Numpy arrays in .npy Dateien speichern
+np.save(data_path + "data.npy", data)
+np.save(data_path + "labels.npy", labels)
+np.save(data_path + "wavelengths.npy", wavelengths)
+```
+
+%% Output
+
+    Länge der Liste wavelength ist: 3267
+    Länge der Liste wavelength ist: 2690
+    Länge der Liste wavelength ist: 3483
+    Länge der Liste wavelength ist: 3521
+    0.4% waren nicht erfolgreich bei der Klasse:AGN
+    Länge der Liste wavelength ist: 3521
+    Länge der Liste wavelength ist: 3502
+    Länge der Liste wavelength ist: 3511
+    Länge der Liste wavelength ist: 3521
+    Länge der Liste wavelength ist: 3493
+    Länge der Liste wavelength ist: 3519
+    Länge der Liste wavelength ist: 3506
+    Länge der Liste wavelength ist: 3477
+    Länge der Liste wavelength ist: 3487
+    Länge der Liste wavelength ist: 3486
+    Länge der Liste wavelength ist: 3503
+    Länge der Liste wavelength ist: 3470
+    Länge der Liste wavelength ist: 3513
+    Länge der Liste wavelength ist: 3503
+    Länge der Liste wavelength ist: 3470
+    Länge der Liste wavelength ist: 3503
+    Länge der Liste wavelength ist: 3467
+    Länge der Liste wavelength ist: 3469
+    Länge der Liste wavelength ist: 3494
+    Länge der Liste wavelength ist: 3461
+    Länge der Liste wavelength ist: 3423
+    Länge der Liste wavelength ist: 3507
+    Länge der Liste wavelength ist: 3433
+    Länge der Liste wavelength ist: 3487
+    Länge der Liste wavelength ist: 3484
+    Länge der Liste wavelength ist: 3470
+    Länge der Liste wavelength ist: 3469
+    Länge der Liste wavelength ist: 3447
+    Länge der Liste wavelength ist: 3447
+    Länge der Liste wavelength ist: 3511
+    3.0% waren nicht erfolgreich bei der Klasse:galaxy
+    Länge der Liste wavelength ist: 3516
+    Länge der Liste wavelength ist: 3495
+    Länge der Liste wavelength ist: 3116
+    0.3% waren nicht erfolgreich bei der Klasse:QSO
+    Länge der Liste wavelength ist: 3461
+    Länge der Liste wavelength ist: 3472
+    Länge der Liste wavelength ist: 3475
+    Länge der Liste wavelength ist: 3468
+    Länge der Liste wavelength ist: 3444
+    Länge der Liste wavelength ist: 3469
+    Länge der Liste wavelength ist: 3439
+    Länge der Liste wavelength ist: 3459
+    Länge der Liste wavelength ist: 3424
+    Länge der Liste wavelength ist: 3431
+    Länge der Liste wavelength ist: 3521
+    Länge der Liste wavelength ist: 3441
+    Länge der Liste wavelength ist: 3515
+    Länge der Liste wavelength ist: 3237
+    1.4000000000000001% waren nicht erfolgreich bei der Klasse:star
+
+%% Cell type:code id:85504e55 tags:
+
+``` python
+```
--- a/notebooks/spectral_classifier_big/loss_graph_v2.png
+++ b/notebooks/spectral_classifier_big/loss_graph_v2.png
--- a/notebooks/spectral_classifier_big/network_h5/spectral_classifier_v2.h5
+++ b/notebooks/spectral_classifier_big/network_h5/spectral_classifier_v2.h5
--- a/notebooks/spectral_classifier_big/speclist.txt
+++ b/notebooks/spectral_classifier_big/speclist.txt
--- a/notebooks/spectral_classifier_big/spectral_classifier.ipynb
+++ b/notebooks/spectral_classifier_big/spectral_classifier.ipynb
--- a/notebooks/spectral_classifier_big/spectral_classifier_from_npy.ipynb
+++ b/notebooks/spectral_classifier_big/spectral_classifier_from_npy.ipynb