gitextract_wihh10ju/ ├── .gitignore ├── .vimrc ├── LICENSE ├── README.rst ├── coursera-sequence-models/ │ ├── README.rst │ └── week-1-building-recurrent-network/ │ ├── dino.py │ ├── dinos.txt │ ├── input.txt │ ├── rnn.py │ ├── rnn_provided.py │ ├── rnn_utils.py │ ├── shakespeare.txt │ └── utils.py ├── cs231n/ │ ├── _z.py │ ├── cifar10.py │ ├── k_nearest_neighbor.py │ ├── k_nearest_neighbor_test.py │ ├── linear_classifier.py │ ├── linear_svm.py │ ├── math_utils.py │ ├── neural_net.py │ ├── run_knn.py │ ├── run_nn.py │ ├── run_svm.py │ ├── softmax.py │ └── timer.py ├── gradients/ │ ├── numgrad.py │ ├── sigmoid.py │ └── tanh.py ├── linear-regression/ │ ├── CCPP-dataset/ │ │ ├── Readme.txt │ │ └── data.csv │ ├── README.rst │ ├── multiple_linear_regression.py │ ├── multiple_linear_regression_test.py │ ├── simple_linear_regression.py │ ├── simple_linear_regression_test.py │ └── timer.py ├── llama2-from-scratch/ │ ├── .gitignore │ ├── .python-version │ ├── README.md │ ├── download.sh │ ├── inference.py │ ├── model.py │ └── pyproject.toml ├── logistic-regression/ │ ├── .gitignore │ ├── .vimrc │ ├── README.rst │ ├── mnist_binary_classifier.py │ ├── mnist_dataset.py │ ├── mnist_multinomial_classifier.py │ ├── mnist_softmax_classifier.py │ ├── plot_binary_decision.py │ ├── plot_binary_losses.py │ ├── plot_sigmoid.py │ ├── regression_lib.py │ ├── regression_lib_test.py │ ├── simple_binary_classifier.py │ └── timer.py ├── min-char-rnn/ │ ├── cnus-clean.txt │ ├── cnus.txt │ ├── input.txt │ ├── markov-model.py │ ├── min-char-lstm.py │ ├── min-char-rnn.py │ └── preprocess-cnus.py ├── nanogpt-lecture/ │ ├── .python-version │ ├── README.md │ ├── bigram.py │ ├── explore-input.py │ ├── gpt.py │ ├── input.txt │ └── pyproject.toml ├── numpy-shapes-tutorial/ │ ├── .python-version │ ├── hello.py │ ├── pyproject.toml │ └── shapes.py ├── pytorch-samples/ │ ├── .python-version │ ├── README.md │ ├── attention-head.py │ ├── basic-device.py │ ├── cross-entropy.py │ ├── linear-compare.py │ ├── moe.py │ ├── pyproject.toml │ ├── topk.py │ └── where.py ├── softmax/ │ ├── softmax.py │ └── softmax_test.py ├── tensorflow-cnn-tutorial/ │ ├── .gitignore │ ├── README.md │ ├── predict.py │ └── train.py ├── tensorflow-samples/ │ ├── basic_operations.py │ ├── conv2d-numpy.py │ ├── conv2d.py │ ├── embedding_partitioned.py │ ├── embedding_shape.py │ ├── embedding_shape_extra_dim.py │ └── reduce_sum.py ├── transformer-attention/ │ ├── .python-version │ ├── README.md │ ├── experimental/ │ │ └── position_enc_sin.py │ ├── moe.py │ ├── multiheadattention.py │ ├── pyproject.toml │ ├── selfattention.py │ ├── softmax.py │ ├── test_moe.py │ ├── test_multiheadattention.py │ └── test_selfattention.py ├── ud730/ │ ├── .gitignore │ ├── .vimrc │ ├── assign1_train_logistic.py │ ├── assign2_tf_sgd.py │ ├── assign3_regularization.py │ ├── assign4_conv.py │ ├── assign5_cbow.py │ ├── assign5_word2vec.py │ ├── assign6.py │ ├── check_images_dir.py │ ├── notmnist_prepare_data.py │ ├── softmax.py │ ├── timer.py │ ├── utils.py │ └── word_utils.py ├── understanding-deep-learning-book/ │ ├── nb-04-03-deep-networks.py │ ├── nb-10-01-1d-convolution.py │ ├── nb-12-01-self-attention.py │ └── nb-12-02-multihead-attention.py └── word2vec-jax/ ├── .gitignore ├── .python-version ├── README.md ├── download-dataset.sh ├── make-train-data.py ├── pyproject.toml ├── similar-words.py └── train.py