diff --git a/Copy_of_WoeBot.ipynb b/Copy_of_WoeBot.ipynb
new file mode 100644
index 00000000..58670e6f
--- /dev/null
+++ b/Copy_of_WoeBot.ipynb
@@ -0,0 +1,2999 @@
+{
+  "nbformat": 4,
+  "nbformat_minor": 0,
+  "metadata": {
+    "colab": {
+      "name": "Copy of WoeBot.ipynb",
+      "provenance": [],
+      "collapsed_sections": [],
+      "toc_visible": true,
+      "authorship_tag": "ABX9TyMQNRt6oGvddwzIWYE/uLIu",
+      "include_colab_link": true
+    },
+    "kernelspec": {
+      "name": "python3",
+      "display_name": "Python 3"
+    },
+    "language_info": {
+      "name": "python"
+    }
+  },
+  "cells": [
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "view-in-github",
+        "colab_type": "text"
+      },
+      "source": [
+        "<a href=\"https://colab.research.google.com/github/Dom1984/python/blob/master/Copy_of_WoeBot.ipynb\" target=\"_parent\"><img src=\"https://colab.research.google.com/assets/colab-badge.svg\" alt=\"Open In Colab\"/></a>"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "Ax0sOCbIrHm4"
+      },
+      "source": [
+        "# Housekeeping"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "GF-u0Uh4Aw2o"
+      },
+      "source": [
+        "Import the relevant libraries and load in the data."
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "nSNRXOvj6aPX"
+      },
+      "source": [
+        "# Import required libraries\n",
+        "import numpy as np\n",
+        "import pandas as pd\n",
+        "import os\n",
+        "from os import path\n",
+        "import matplotlib.pyplot as plt\n",
+        "import seaborn as sns\n",
+        "from scipy.stats import pearsonr"
+      ],
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/"
+        },
+        "id": "n6OjJyib7C_9",
+        "outputId": "df81f735-d642-4bb1-d3f9-536fc1bd6884"
+      },
+      "source": [
+        "# 1. Mount Google Drive to access data\n",
+        "from google.colab import drive\n",
+        "drive.mount('/content/drive')"
+      ],
+      "execution_count": null,
+      "outputs": [
+        {
+          "output_type": "stream",
+          "text": [
+            "Mounted at /content/drive\n"
+          ],
+          "name": "stdout"
+        }
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/",
+          "height": 35
+        },
+        "id": "5c8-QALt7J3Z",
+        "outputId": "bc53dda6-c4bc-4a47-eb7f-305ecff2cb27"
+      },
+      "source": [
+        "# 2. Check current drive\n",
+        "os.getcwd()"
+      ],
+      "execution_count": null,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "application/vnd.google.colaboratory.intrinsic+json": {
+              "type": "string"
+            },
+            "text/plain": [
+              "'/content'"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 3
+        }
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "iQdmtbmq6qMF"
+      },
+      "source": [
+        "# 3. Choose folder where datasets are stored\n",
+        "os.chdir('/content/drive/My Drive/Colab Notebooks/')\n"
+      ],
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "db9LdXTR6aUz"
+      },
+      "source": [
+        "# 4. Read in both csv files\n",
+        "survey_responses = pd.read_csv(\"survey_responses.csv\")\n",
+        "user_activty = pd.read_csv(\"user_activity.csv\")"
+      ],
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "IJ70QYHyk9-b"
+      },
+      "source": [
+        "# Data Exploration"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "C0ZtaBu-rncB"
+      },
+      "source": [
+        "Before commencing the three assigned tasks, some basic data exploration is undertaken to understand the structure of the datasets"
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/",
+          "height": 204
+        },
+        "id": "-v2t0T2YS1z5",
+        "outputId": "98e636e8-0256-47a5-93ad-e5ecd7cc7711"
+      },
+      "source": [
+        "survey_responses.head(5)\n"
+      ],
+      "execution_count": null,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "text/html": [
+              "<div>\n",
+              "<style scoped>\n",
+              "    .dataframe tbody tr th:only-of-type {\n",
+              "        vertical-align: middle;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe tbody tr th {\n",
+              "        vertical-align: top;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe thead th {\n",
+              "        text-align: right;\n",
+              "    }\n",
+              "</style>\n",
+              "<table border=\"1\" class=\"dataframe\">\n",
+              "  <thead>\n",
+              "    <tr style=\"text-align: right;\">\n",
+              "      <th></th>\n",
+              "      <th>userid</th>\n",
+              "      <th>mobilePlatform</th>\n",
+              "      <th>tenureDay</th>\n",
+              "      <th>waiBondSubscore</th>\n",
+              "    </tr>\n",
+              "  </thead>\n",
+              "  <tbody>\n",
+              "    <tr>\n",
+              "      <th>0</th>\n",
+              "      <td>D2d+QvZOh6hbgFwBR9totchAC5k=</td>\n",
+              "      <td>ios</td>\n",
+              "      <td>5</td>\n",
+              "      <td>2.75</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>1</th>\n",
+              "      <td>UQq1EvExGUr3eEXbGObbiV+Mrtg=</td>\n",
+              "      <td>android</td>\n",
+              "      <td>6</td>\n",
+              "      <td>3.75</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>2</th>\n",
+              "      <td>qVyzInBHD+KDwYneOtRGUIjT17o=</td>\n",
+              "      <td>ios</td>\n",
+              "      <td>4</td>\n",
+              "      <td>3.25</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>3</th>\n",
+              "      <td>TAyM8LnnIjACZL1w3ckYmZZwe3o=</td>\n",
+              "      <td>android</td>\n",
+              "      <td>5</td>\n",
+              "      <td>4.75</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>4</th>\n",
+              "      <td>1vsxQ6OylVGzSrvt8PDMr9UXda4=</td>\n",
+              "      <td>ios</td>\n",
+              "      <td>5</td>\n",
+              "      <td>4.00</td>\n",
+              "    </tr>\n",
+              "  </tbody>\n",
+              "</table>\n",
+              "</div>"
+            ],
+            "text/plain": [
+              "                         userid mobilePlatform  tenureDay  waiBondSubscore\n",
+              "0  D2d+QvZOh6hbgFwBR9totchAC5k=            ios          5             2.75\n",
+              "1  UQq1EvExGUr3eEXbGObbiV+Mrtg=        android          6             3.75\n",
+              "2  qVyzInBHD+KDwYneOtRGUIjT17o=            ios          4             3.25\n",
+              "3  TAyM8LnnIjACZL1w3ckYmZZwe3o=        android          5             4.75\n",
+              "4  1vsxQ6OylVGzSrvt8PDMr9UXda4=            ios          5             4.00"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 176
+        }
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/",
+          "height": 385
+        },
+        "id": "pRyXYE3aXqXg",
+        "outputId": "23490113-5e5c-4ecb-b634-4035cff95c76"
+      },
+      "source": [
+        "sns.displot(survey_responses[[\"tenureDay\", \"waiBondSubscore\"]], x = survey_responses[\"tenureDay\"], bins=16, alpha = 0.5).set(title=\"Distribution count of Tenure day waiBondSubscores were received on\")\n",
+        "plt.show()"
+      ],
+      "execution_count": null,
+      "outputs": [
+        {
+          "output_type": "display_data",
+          "data": {
+            "image/png": "iVBORw0KGgoAAAANSUhEUgAAAbAAAAFwCAYAAADZpi6eAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4yLjIsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy+WH4yJAAAgAElEQVR4nO3debgcZZn+8e9Nwr4jRwaSQFgCCoyyhMUFRUEIiIKOgzAKwS0i4DKgDoij/EBGfirLIA7IEgHZZRmiwxZRQAWEAGE3EiCQxJAEkGVEQeCZP973kKLpPqdPTp/ufk/uz3X1dbrf2p7qrqq7q7pOlSICMzOz0izV6QLMzMwWhwPMzMyK5AAzM7MiOcDMzKxIDjAzMyuSA8zMzIrUkgCTdJqkf2/RuNaV9L+SRuTXN0j6bCvGncd3taSJrRpfySStJekmSc9LOr7T9bSapAMk/bbTddRTu5y3edote18kzZK0cyvGZe0h6RuSzhyC8bZ9fes3wPIC+te8kXtG0s2SDpT02rARcWBEHNPkuPpc2CPi8YhYKSJeaW4W+pzeUZLOqxn/bhFxzmDH3Q0knS3pO4MYxSTgSWCViDisZtxX5w3s/0r6u6SXKq9PG1Th9oblPH9R+1t+f5/NXyz+sR21SNpT0nRJz0l6UtKvJK3fjmlb+0XEf0REy3YKOqnZPbAPRcTKwHrAccC/AWe1uhhJI1s9TuvTesADUee/2XPQrxQRKwHnA9/rfR0RB7ajuE7snXTYIfn9XgO4AfjpUE9Q0kbAucBhwKrA+sCPgEF/gRxq3b69GGx93T5/XSEi+nwAs4Cda9q2BV4FNs+vzwa+k5+vCfwCeAZ4GvgNKSh/mof5K/C/wNeBsUAAnwEeB26qtI3M47sB+C5wG/AccCWwRu62IzCnXr3ABOAl4O95endXxvfZ/Hwp4JvAY8AC0oq8au7WW8fEXNuTwJF9vE/LA8fncT0L/BZYPnf7MHB/fk9uAN5aGS6AjSqvq+/ljsAc0sZlATAP+FTuNinP20t5/n7eoK53Arfnmm4H3lmZTnX4nfuYt9dqyq/3AKbn+bkZeFvN+/9V4J48zYuB5XK3A4Df1oz7tfnP0zkVuAr4S/4c1wEuAxYCjwJf6qPONwFT8nJyG3BMdXrAfwKzc/c7gB1y+z8ALwBvqvS7VZ7m0jXTWI60DK+ZXx8JvEzaiyVP86T8/IPAXXl6s4GjKuMZyxuX889Wum8KvFR5vSxwEvCn/DgJWLa/5aS/9wX4GDB9AJ/9jlTWufx5HwE8APwZ+Enl8667LcjdxgCX5/f4KeCUAayTr20vcvungQfz9K8F1svtAk7M43kOuJe8zaqZx/cB91ZeTwVur7z+DbBXft5weQSOAi4FzsvT+yzpS8FZ+TOZC3wHGNHgvR7w8MDn8rw/nz+DrZqs87z8/GrSF6dqHXcDH83P35Lfj6eBGcDeza5vdeavr+3gLBpsN/p6LFaA5fbHgS/U2eh+FzgNWDo/dgBUb1wsWiDPBVYkhUBvW3XFngtsnvu5rPLm70iDAKv9oCrdb2BRgH0amAlsAKxEWqF+WlPbGbmutwMvVt/0mvH+KI97FDCCFBzLAhuTNsYfyO/H1/M0l6ndgNd5L3ckbRyPzsPuTtrQrl5v41KnpjVIK/V+wEhg3/z6Tc0M36CmLUkbhO3yfE7M73nvxnQWaWFeJ0//QeDA3O0A+g+wZ4F3kTZkK5CC5lvAMvlzegTYtUGdFwGX5OVkc9JyUw2wT5JWupGkjf0TLNrYXkVenvPrE4EfNpjOTcA/5efXAQ8Du1W6faTy+f1jnpe3AfNZtCEcS4MAy/N6LHkDnduOBm4F3gz0kL44HNPkctLwfcnv6d/y/L4PWKnRZ19vncuf932kQFoD+B39bAtIy83deZorkr4UvHsA62R1e7Fn7v+t+XP9JnBz7n9X0vKzWp7uW4G163yey+f3YM1c5/z8Hq2cu/2VtNwsRR/LI2l783dgr9zv8sAVwI9zvW8mrRufb7BcDWh44J9zndvk+duIdFSlmTp7t6H7A7+r1LApKWCWzdOcDXwqv7dbkr7Ib9rM+lYzb/1tB2fRYLsxVAF2K3mPhNdv4I4m7SVt1N+4WLRAblCnrbpiH1fzBr9EWgl2ZHABdj1wUKXbJnkBGlmpY3Sl+23APnXmaynSQv72Ot3+Hbikpt+5wI61G/A67+WOebwjK90XANvX27jUmfZ+wG01bbcABzQzfIOaTiVvOCvdZwDvrbz/n6x0+x5wWn5+AP0H2LmVbtsBj9f0fwTwkzo1jsif3Vsqbf9RO72aYf7c+5kBHyevyHlcTwDbNhjuGODkvJw8AXyZdGi9d+/sTQ2GOwk4sY/l/AXSxuNFUpDvVBn2YWD3yutdgVn9LSfNvC+5v0tI39b/lj+HleotI9QPsAMrr3cHHu5rWwC8I09rZJ33qJl1srq9uBr4TM369QJpQ/5+4I95/pbqZxn/DfDR3O91+f2YQAr1e5pZHknbm+qXjrXyZ7l8pW1f4NcNahjQ8KS9zS/XGU8zdfYG2MqkYFkvvz4WmFxZJ35TM54fA99uZrmqGa6/7eAsGmw3+noM5izEUaTdylrfJyXrdZIekXR4E+OaPYDuj5ESfM2mquzbOnl81XGPJC04vZ6oPH+B9K2w1pqkjdfD/U0jIl4lzc+oJmt8KiJebqKGemrnj/y62WnXsx5wWD6h5xlJz5C+fa9T6aeZ96yR6me9HrBOzbS+wes/n149pM+udll5jaSvSnownyTxDOnwTO9ydCWwaT554QPAsxFxW4MabyRtyLciHZaaCryXtPGbGRFP5eltJ+nXkhZKehY4kL6X2y9FxGqkb957AJdKelvuVm9Zrb7njZaTft+XiLg1IvaOiB7SXtJ7SIdGm1U77t66Gm0LxgCP1dTbq5l1snYZ+c/K8vE0aW9kVET8CjiFdHRkgaTTJa3SYB56P9P35Oc3kD7T9+bXvdPqb3msrW1pYF6l/x+T9qQaGcjwY6i/zWl6vYmI54H/AfbJTfuSfvPuHc92NeP5BOmQe7/LVY1mtoMD3m4sVoBJ2iZP+A2nTEbE8xFxWERsQDrmeaiknXo7Nxhlo/ZeYyrP1yUl/5Okbw4rVOoaQXpjmx3vn0gfUnXcL5MOIQzEk6Rvrhv2Nw1JIs3P3Nz0ApV5IC0czRro/EGax7l1+m3WbODYiFit8lghIi5sYtjaz6vevFbnaTbwaM20Vo6I3esMt5D02dUuK73T2oF02GJv0qG11Uh7OQKIiL+RvnV/krTn2tcJFDeT9gw+AtwYEQ/kae3Ooo0dwAWk3wjGRMSqpMNp6mO85FpejYjfkDb+u+Tmesvqn/obF/28L3WmfTvpsN3muel1nxn1l8/acf8pj6vRtmA2sG6DkxSaWSdrl5HP1ywjy0fEzbmGkyNia9KRm42BrzWY9doAu5E3Blgzy2NtbS+Sfi/t7X+ViNisQQ0DHX429bc5A1lvAC4E9pX0DtIX8V9XxnNjzXhWiogvMMDliv63g4tlQAEmaRVJe5COfZ4XEffW6WcPSRvlAp8lnc30au48n3Q8dqA+KWlTSSuQDktcGun04z8Cy0n6oKSlSce/l60MNx8YWz3lv8aFwL9KWl/SSqRd4IsbfDNsKH+bmAycIGkdSSMkvUPSsqSN4gcl7ZRrPIy0UN6cB58O/EseZgJphWlWf+/nVcDGkv5F0khJHyetyL8YyPzVOAM4MO9dSNKK+f1fuYlh7wY2k7SFpOVIhzL6chvwvKR/k7R8fo82z1+gXicvD5cDR0laQdKmpN/neq1MWuEWAiMlfQuo/TZ+Lukw54fpI8Ai4gXSbwwHs2jjdjNpD6saYCsDT0fE3yRtC/xLP/P7mrwx2ZT0ozekZfWbknokrUn6feO8RsNXau3zfZH0bkmfk/Tm/PotpPm/NfcyHdhd0hr5C8dX6kzmYEmjJa1B2nO7OI+r0bbgNtJJCcfl5Wc5Se+qzOdA1snTgCMkbZanuaqkf87Pt8nL6dKkIP4bi7ZFtXq/lGxLOux+P3kPhPS7JgxgeQSIiHmkw5HH523nUpI2lNTUOt7E8GcCX5W0dV4XN5K03kDrJG0n1iNtWy/O2zNI24mNJe0naen82EbSW5tY32r1tx1cLM0G2M8lPU9K5COBE0g/7NUzDvgl6cy2W4D/iojeRP8uaSV8RtJXB1DnT0nH4p8gfUP4EkBEPAscRPog55IW0jmV4X6W/z4l6c46452cx30T6UydvwFfHEBdVV8lHU66nXQY4/+TjrvPIH2r/yFpT+1DpH9LeCkP9+Xc1rt7/t8DmOZZpMNez0h6w3D5UNYepIXlKdIeyB4R8eTAZ++1cU4jnfl0Cuk3pJmkjX4zw/6RtJL8EniIOnvwNf2/Qqp/C9Ln8yTps161wSCHkA47PEFaXn5S6XYtcA3pS89jpM/6dYeuI+J3pA3cnRHR1+EQSEG1NGlj0ft6ZRZt7CAtm0fndedbpJW4L6co/68dabn8ZkRcnbt9B5hGOkvrXuDO3NaMvt6XZ0iBdW+e7jWkEwe+l7v/lPTFYxZpY3pxnfFfkLs9Qjqk1VtX3W1B/lw/RDrp4HHSOvvxPMyA1smIuIK0rl0k6TnSCSW75c6rkL5w/Zn0mT9FOqxZbzx/Ib2n91fWzVtIhzoX5H4GujxCOkliGRadpXkpsHYf/Tc9fET8jPSb1QWksxD/m3SG9oDqjIgXSWG0cx5Xb/vzpCMA+5D2oJ4gvde9Owl9LVe10+hvO7hYes8ONDNA0q+ACyKi5VcqMLPWcoCZZfkQy1TSb1bPd7oeM+ubL+ZrBkg6h3S46ysOL7MyeA/MzMyK5D0wMzMrki8W2cCECRPimmuu6XQZZmbQxP8PLom8B9bAk08u9pnmZmbWBg4wMzMrkgPMzMyK5AAzM7MiOcDMzKxIDjAzMyuSA8zMzIrU1QEmaYzSDQEfkHS/pC/n9jUkTZX0UP67em6XpJMlzZR0j6StKuOamPt/SFJfl/03M7MCdHWAke7fdFhEbEq62+3B+b4zhwPXR8Q40i3Ie+/0uhvpFg7jgEnAqZACj3Qb7O1I9/v5dm/omZlZmbo6wCJiXkTcmZ8/DzxIuhP0nsA5ubdzgL3y8z2BcyO5FVhN0trArsDUiHg6Iv5MuuL4hDbOipmZtVhXB1iVpLHAlsDvgbXy3Uoh3Uxtrfx8FK+/SeGc3NaovXYakyRNkzRt4cKFLa3fzMxaq4gAy7cWv4x0q4vnqt0iXU6/JZfUj4jTI2J8RIzv6elpxSjNzGyIdH2ASVqaFF7nR8TluXl+PjRI/rsgt88FxlQGH53bGrWbmVmhujrAJAk4C3gwIk6odJoC9J5JOBG4stK+fz4bcXvg2Xyo8VpgF0mr55M3dsltZmZWqK4OMOBdwH7A+yVNz4/dgeOAD0h6CNg5vwa4CngEmAmcARwEEBFPA8cAt+fH0bmt64xZdz0kLfZjzLrrdXoWzMzawndkbmD8+PExbdq0tk9XEidcN2Oxhz90l03wZ2o27Ph+YHV0+x6YmZlZXQ4wMzMrkgPMzMyK5AAzM7MiOcDMzKxIDjAzMyuSA8zMzIrkADMzsyI5wMzMrEgOMDMzK5IDzMzMiuQAa6HBXog3XXzfzMyaMbLTBQwnc2Y/PqgL8UK6GK+ZmfXPe2BmZlYkB5iZmRXJAWZmZkVygJmZWZEcYGZmViQHmJmZFckBZmZmRXKAmZlZkRxgZmZWJAeYmZkVyQFmZmZFcoCZmVmRHGBmZlYkB5iZmRXJAWZmZkXq6gCTNFnSAkn3VdouljQ9P2ZJmp7bx0r6a6XbaZVhtpZ0r6SZkk6W7xxpZla8br+h5dnAKcC5vQ0R8fHe55KOB56t9P9wRGxRZzynAp8Dfg9cBUwArh6Ces3MrE26eg8sIm4Cnq7XLe9F7Q1c2Nc4JK0NrBIRt0ZEkMJwr1bXamZm7dXVAdaPHYD5EfFQpW19SXdJulHSDrltFDCn0s+c3PYGkiZJmiZp2sKFC4emajMza4mSA2xfXr/3NQ9YNyK2BA4FLpC0ykBGGBGnR8T4iBjf09PTwlLNzKzVuv03sLokjQQ+Cmzd2xYRLwIv5ud3SHoY2BiYC4yuDD46t5mZWcFK3QPbGfhDRLx2aFBSj6QR+fkGwDjgkYiYBzwnafv8u9n+wJWdKNrMzFqnqwNM0oXALcAmkuZI+kzutA9vPHnjPcA9+bT6S4EDI6L3BJCDgDOBmcDD+AxEM7PidfUhxIjYt0H7AXXaLgMua9D/NGDzlhZnZmYd1dV7YGZmZo04wMzMrEgOMDMzK5IDzMzMiuQAMzOzIjnAzMysSA4wMzMrkgPMzMyK5AAzM7MiOcDMzKxIDjAzMyuSA8zMzIrkADMzsyI5wMzMrEgOMDMzK5IDzMzMiuQAMzOzIjnAzMysSA4wMzMrkgPMzMyK5AAzM7MiOcDMzKxIDjAzMyuSA8zMzIrkADMzsyI5wMzMrEgOMDMzK5IDzMzMitTVASZpsqQFku6rtB0laa6k6fmxe6XbEZJmSpohaddK+4TcNlPS4e2eDzMza72uDjDgbGBCnfYTI2KL/LgKQNKmwD7AZnmY/5I0QtII4EfAbsCmwL65XzMzK9jIThfQl4i4SdLYJnvfE7goIl4EHpU0E9g2d5sZEY8ASLoo9/tAi8s1M7M26vY9sEYOkXRPPsS4em4bBcyu9DMntzVqfwNJkyRNkzRt4cKFQ1G3mZm1SIkBdiqwIbAFMA84vlUjjojTI2J8RIzv6elp1WjNzGwIdPUhxHoiYn7vc0lnAL/IL+cCYyq9js5t9NFuZmaFKm4PTNLalZcfAXrPUJwC7CNpWUnrA+OA24DbgXGS1pe0DOlEjyntrNnMzFqvq/fAJF0I7AisKWkO8G1gR0lbAAHMAj4PEBH3S7qEdHLGy8DBEfFKHs8hwLXACGByRNzf5lkxM7MW6+oAi4h96zSf1Uf/xwLH1mm/CriqhaWZmVmHFXcI0czMDBxgZmZWKAeYmZkVyQFmZmZFcoCZmVmRHGBmZlYkB5iZmRXJAWZmZkVygJmZWZEcYGZmViQHmJmZFckBZmZmRXKAmZlZkRxgZmZWJAeYmZkVyQFmZmZFcoCZmVmRHGBmZlYkB5iZmRXJAWZmZkVygJmZWZEcYGZmViQHmJmZFckBZmZmRXKAmZlZkRxgZmZWJAeYmZkVyQFmZmZF6uoAkzRZ0gJJ91Xavi/pD5LukXSFpNVy+1hJf5U0PT9OqwyztaR7Jc2UdLIkdWJ+zMysdbo6wICzgQk1bVOBzSPibcAfgSMq3R6OiC3y48BK+6nA54Bx+VE7TjMzK0xXB1hE3AQ8XdN2XUS8nF/eCozuaxyS1gZWiYhbIyKAc4G9hqJeMzNrn64OsCZ8Gri68np9SXdJulHSDrltFDCn0s+c3PYGkiZJmiZp2sKFC4emYjMza4liA0zSkcDLwPm5aR6wbkRsCRwKXCBplYGMMyJOj4jxETG+p6entQWbmVlLjex0AYtD0gHAHsBO+bAgEfEi8GJ+foekh4GNgbm8/jDj6NxmZmYFK24PTNIE4OvAhyPihUp7j6QR+fkGpJM1HomIecBzkrbPZx/uD1zZgdLNzKyFunoPTNKFwI7AmpLmAN8mnXW4LDA1nw1/az7j8D3A0ZL+DrwKHBgRvSeAHEQ6o3F50m9m1d/NzMysQF0dYBGxb53msxr0exlwWYNu04DNW1iamZl1WHGHEM3MzMABZmZmhXKAmZlZkRxgZmZWJAeYmZkVyQFmZmZFcoCZmVmRHGBmZlYkB5iZmRXJAWZmZkVygJmZWZEcYGZmViQHmJmZFckBZmZmRWpLgEl6VzNtZmZmzWrXHtgPm2wzMzNrypDe0FLSO4B3Aj2SDq10WgUYMZTTNjOz4W2o78i8DLBSns7KlfbngI8N8bTNzGwYG9IAi4gbgRslnR0Rjw3ltMzMbMky1HtgvZaVdDowtjrNiHh/m6ZvZmbDTLsC7GfAacCZwCttmqaZmQ1j7QqwlyPi1DZNy8zMlgDtOo3+55IOkrS2pDV6H22atpmZDUPt2gObmP9+rdIWwAZtmr6ZmQ0zbQmwiFi/HdMxM7MlR1sCTNL+9doj4tx2TN/MzIafdh1C3KbyfDlgJ+BOwAFmZmaLpV2HEL9YfS1pNeCidkzbzMyGp07dTuUvQL+/i0maLGmBpPsqbWtImirpofx39dwuSSdLminpHklbVYaZmPt/SNLEetMyM7OytOt2Kj+XNCU//geYAVzRxKBnAxNq2g4Hro+IccD1+TXAbsC4/JgEnJqnvQbwbWA7YFvg272hZ2Zm5WrXb2A/qDx/GXgsIub0N1BE3CRpbE3znsCO+fk5wA3Av+X2cyMigFslrSZp7dzv1Ih4GkDSVFIoXriY82JmZl2gLXtg+aK+fyBdkX514KVBjG6tiJiXnz8BrJWfjwJmV/qbk9satb+BpEmSpkmatnDhwkGUaGZmQ61dhxD3Bm4D/hnYG/i9pEHfTiXvbcVgx1MZ3+kRMT4ixvf09LRqtGZmNgTadQjxSGCbiFgAIKkH+CVw6WKMa76ktSNiXj5EuCC3zwXGVPobndvmsuiQY2/7DYsxXTMz6yLtOgtxqd7wyp4axLSnsOjSVBOBKyvt++ezEbcHns2HGq8FdpG0ej55Y5fcZmZmBWvXHtg1kq5l0YkTHweu6m8gSReS9p7WlDSHdDbhccAlkj4DPEY6JEke3+7ATOAF4FMAEfG0pGOA23N/R/ee0GFmZuUa0gCTtBHppIuvSfoo8O7c6Rbg/P6Gj4h9G3TaqU6/ARzcYDyTgclNFW1mZkUY6j2wk4AjACLicuByAEn/mLt9aIinb2Zmw9RQ/wa2VkTcW9uY28YO8bTNzGwYG+oAW62PbssP8bTNzGwYG+oAmybpc7WNkj4L3DHE0zYzs2FsqH8D+wpwhaRPsCiwxgPLAB8Z4mmbmdkwNqQBFhHzgXdKeh+weW7+n4j41VBO18zMhr923Q/s18Cv2zEtMzNbMnTqfmBmZmaD4gAzM7MiOcDMzKxIDjAzMyuSA8zMzIrkADMzsyI5wMzMrEgOMDMzK5IDzMzMiuQAMzOzIjnAzMysSA4wMzMrkgPMzMyK5AAzM7MiOcDMzKxIDjAzMyuSA8zMzIrkADMzsyI5wMzMrEgOMDMzK5IDzMzMilRkgEnaRNL0yuM5SV+RdJSkuZX23SvDHCFppqQZknbtZP1mZjZ4IztdwOKIiBnAFgCSRgBzgSuATwEnRsQPqv1L2hTYB9gMWAf4paSNI+KVthZuZmYtU+QeWI2dgIcj4rE++tkTuCgiXoyIR4GZwLZtqc7MzIbEcAiwfYALK68PkXSPpMmSVs9to4DZlX7m5DYzMytU0QEmaRngw8DPctOpwIakw4vzgOMHOL5JkqZJmrZw4cKW1mpmZq1VdIABuwF3RsR8gIiYHxGvRMSrwBksOkw4FxhTGW50bnudiDg9IsZHxPienp4hLt3MzAaj9ADbl8rhQ0lrV7p9BLgvP58C7CNpWUnrA+OA29pWpZmZtVyRZyECSFoR+ADw+Urz9yRtAQQwq7dbRNwv6RLgAeBl4GCfgWhmVrZiAywi/gK8qaZtvz76PxY4dqjrMjOz9ij9EKKZmS2hHGBmZlYkB5iZmRXJAWZmZkVygJmZWZEcYGZmViQHmJmZFckBZmZmRXKAmZlZkRxgZmZWJAeYmZkVyQFmZmZFcoCZmVmRHGBmZlYkB5iZmRXJAWZmZkVygJmZWZEcYGZmViQHmJmZFckBZmZmRXKAmZlZkRxgZmZWJAeYmZkVyQFmZmZFcoCZmVmRHGBmZlYkB5iZmRXJAWZmZkUqNsAkzZJ0r6TpkqbltjUkTZX0UP67em6XpJMlzZR0j6StOlu9mZkNVrEBlr0vIraIiPH59eHA9RExDrg+vwbYDRiXH5OAU9teqZmZtVTpAVZrT+Cc/PwcYK9K+7mR3AqsJmntThQ45LQUkgb1GLPuep2eCzOzfo3sdAGDEMB1kgL4cUScDqwVEfNy9yeAtfLzUcDsyrBzcts8hpt4lROumzGoURy6yyYtKsbMbOiUHGDvjoi5kt4MTJX0h2rHiIgcbk2TNIl0iJF11123dZWamVnLFXsIMSLm5r8LgCuAbYH5vYcG898Fufe5wJjK4KNzW+04T4+I8RExvqenZyjLNzOzQSoywCStKGnl3ufALsB9wBRgYu5tInBlfj4F2D+fjbg98GzlUKOZmRWo1EOIawFXSII0DxdExDWSbgcukfQZ4DFg79z/VcDuwEzgBeBT7S/ZzMxaqcgAi4hHgLfXaX8K2KlOewAHt6E0MzNrkyIPIZqZmTnAzMysSA4wMzMrkgPMzMyK5AAzM7MiOcDMzKxIDjAzMyuSA8zMlhhj1l3Pd2oYRor8R2Yzs8UxZ/bjg7pbg+/U0F28B2ZmZkVygJmZWZEcYGZmViQHmJkVYbAnYOS7V9gw4pM4zKwIgz0BA3wSxnDjPTAzMyuSA8zMzIrkADMzsyI5wMzMrEgOMDMzK5IDzMzMiuQAMzOzIjnAzMysSA4wMzMrkgPMzMyK5AAzM7MiOcDMzKxIDjAzMyuSA8zMzIrkADMzsyIVGWCSxkj6taQHJN0v6cu5/ShJcyVNz4/dK8McIWmmpBmSdu1c9WZm1gql3tDyZeCwiLhT0srAHZKm5m4nRsQPqj1L2hTYB9gMWAf4paSNI+KVtlZtZmYtU+QeWETMi4g78/PngQeBUX0MsidwUUS8GBGPAjOBbYe+UjMzGypFBliVpLHAlsDvc9Mhku6RNFnS6rltFDC7Mtgc6gSepEmSpkmatnDhwiGs2szMBqvoAJO0EnAZ8JWIeA44FdgQ2AKYBxw/kPFFxOkRMT4ixvf09LS8XjMza51iA0zS0qTwOj8iLgeIiPkR8UpEvAqcwaLDhHOBMZXBR+c2MzMrVJEBJknAWcCDEXFCpX3tSm8fAe7Lz6cA+0haVtL6wDjgtnbVa2ZmrVfqWYjvAvYD7pU0Pbd9A9hX0hZAALOAzwNExP2SLgEeIJ3BeLDPQDQzK1uRARYRvwVUp9NVfQxzLHDskBVlZmZtVeQhRPGycxYAAAeaSURBVDMzMweYmZkVyQFmZmZFcoCZmVmRHGBmZlYkB5iZmRXJAWZmZkVygJmZWZEcYGZmViQHmJmZFckBZmbWLC2FpEE9xqy7XqfnYtgo8lqIZmYdEa9ywnUzBjWKQ3fZpEXFmPfAzMysSA4wMzMrkgPMzMyK5AAzM7MiOcDMzKxIDjAzMyuSA8zMzIrkADMzsyI5wMzMrEgOMDMzK5IDzMzMiuQAMzOzIjnAzMysSA4wMzMrkgPMzMyK5AAzM7MiLTEBJmmCpBmSZko6vNP1mJnZ4CwRASZpBPAjYDdgU2BfSZt2tiozMxuMJSLAgG2BmRHxSES8BFwE7NnhmszMbBAUEZ2uYchJ+hgwISI+m1/vB2wXEYfU9DcJmJRfbgLMGOCk1gSeHGS57VZaza53aJVWL5RX8+LU+2RETBiKYko2stMFdJOIOB04fXGHlzQtIsa3sKQhV1rNrndolVYvlFdzafV2syXlEOJcYEzl9ejcZmZmhVpSAux2YJyk9SUtA+wDTOlwTWZmNghLxCHEiHhZ0iHAtcAIYHJE3D8Ek1rsw48dVFrNrndolVYvlFdzafV2rSXiJA4zMxt+lpRDiGZmNsw4wMzMrEgOsBaSNELSXZJ+0ela+iNpNUmXSvqDpAclvaPTNfVF0r9Kul/SfZIulLRcp2uqJWmypAWS7qu0rSFpqqSH8t/VO1ljVYN6v5+XiXskXSFptU7WWFWv3kq3wySFpDU7UVsjjWqW9MX8Pt8v6Xudqq90DrDW+jLwYKeLaNJ/AtdExFuAt9PFdUsaBXwJGB8Rm5NOxNmns1XVdTZQ+8+mhwPXR8Q44Pr8uluczRvrnQpsHhFvA/4IHNHuovpwNm+sF0ljgF2Ax9tdUBPOpqZmSe8jXQno7RGxGfCDDtQ1LDjAWkTSaOCDwJmdrqU/klYF3gOcBRARL0XEM52tql8jgeUljQRWAP7U4XreICJuAp6uad4TOCc/PwfYq61F9aFevRFxXUS8nF/eSvqfya7Q4P0FOBH4OtB1Z6Q1qPkLwHER8WLuZ0HbCxsmHGCtcxJpJXq104U0YX1gIfCTfMjzTEkrdrqoRiJiLulb6uPAPODZiLius1U1ba2ImJefPwGs1cliBujTwNWdLqIvkvYE5kbE3Z2uZQA2BnaQ9HtJN0raptMFlcoB1gKS9gAWRMQdna6lSSOBrYBTI2JL4C9016Gt18m/G+1JCt51gBUlfbKzVQ1cpP9Z6bq9hHokHQm8DJzf6VoakbQC8A3gW52uZYBGAmsA2wNfAy6RpM6WVCYHWGu8C/iwpFmkK92/X9J5nS2pT3OAORHx+/z6UlKgdaudgUcjYmFE/B24HHhnh2tq1nxJawPkv11/uEjSAcAewCeiu/9RdEPSl5q787o3GrhT0j90tKr+zQEuj+Q20lGbrjr5pBQOsBaIiCMiYnREjCWdXPCriOjaPYSIeAKYLWmT3LQT8EAHS+rP48D2klbI31R3ootPOqkxBZiYn08EruxgLf2SNIF0KPzDEfFCp+vpS0TcGxFvjoixed2bA2yVl+9u9t/A+wAkbQwsQ1lX0+8aDrAl1xeB8yXdA2wB/EeH62ko7yleCtwJ3EtabrvucjySLgRuATaRNEfSZ4DjgA9Ieoi0J3lcJ2usalDvKcDKwFRJ0yWd1tEiKxrU29Ua1DwZ2CCfWn8RMLHL93S7li8lZWZmRfIemJmZFckBZmZmRXKAmZlZkRxgZmZWJAeYmZkVyQFmS6R8Nf6DOjj9HSU9my/lNUPSTfmKLmbWJAeYLalWA4Y0wPKFh/vym4jYMiI2IV1t/xRJOw1lTWbDiQPMllTHARvmf9b9vqSvSbo93wfr/wFIGpvvlXZGvm/TdZKWz91ukDQ+P18zX8oISQdImiLpV8D1klbM94S6Le9t7VmvmIiYDhwNHJLH86F8sde7JP1S0lqSlsr3FevJ/SwlaWbva7MljQPMllSHAw9HxBake2CNA7YlXZVka0nvyf2NA36U79v0DPBPTYx7K+BjEfFe4EjSpcW2JV0+6Pt9XPn/TuAt+flvge3zxZYvAr4eEa8C5wGfyP3sDNwdEQubnWmz4aS/QxxmS4Jd8uOu/HolUnA9TrqI8PTcfgcwtonxTY2I3ntA7UK60PNX8+vlgHUbDFe9Ivlo4OJ8AeBlgEdz+2TS9RRPIt3u5CdN1GM2LDnAzFJwfDcifvy6Rmks8GKl6RVg+fz8ZRYdwViuZnx/qRn3P0XEjJpx17sv2JYsukjxD4ETImKKpB2BowAiYrak+ZLeT9pj/ESd8ZgtEXwI0ZZUz5MuWgtwLfBpSSsBSBol6c39DD8L2Do//1gf/V0LfLH3fk+StqzXk6S3Af8O/Cg3rQrMzc8n1vR+JulQ4s8i4pV+6jQbthxgtkSKiKeA3+Urgn8AuAC4RdK9pCvfr9zX8KQ7RH9B0l30fS+nY4ClgXsk3Z9f99qh9zR6UnB9KSKuz92OAn4m6Q7eeKuNKaTDnD58aEs0X43erDD57McTI2KHTtdi1kn+DcysIJIOB76Af/sy8x6YmZmVyb+BmZlZkRxgZmZWJAeYmZkVyQFmZmZFcoCZmVmR/g/tfWvrayixDgAAAABJRU5ErkJggg==\n",
+            "text/plain": [
+              "<Figure size 360x360 with 1 Axes>"
+            ]
+          },
+          "metadata": {
+            "tags": [],
+            "needs_background": "light"
+          }
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "9b_rRq84ZwDR"
+      },
+      "source": [
+        "The distribution is imbalanced, there are a much higher volume of bond scores received on days 4, 5 than on any other days.\n",
+        "\n",
+        "This may have been due to how the data was collected, perhaps there was a push to get partcipants to log a score on those days."
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "FjGC1c3D7gO2",
+        "colab": {
+          "base_uri": "https://localhost:8080/",
+          "height": 297
+        },
+        "outputId": "71f2876d-bba0-4db7-c9bb-3a70c64cfb8e"
+      },
+      "source": [
+        "survey_responses.describe()"
+      ],
+      "execution_count": null,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "text/html": [
+              "<div>\n",
+              "<style scoped>\n",
+              "    .dataframe tbody tr th:only-of-type {\n",
+              "        vertical-align: middle;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe tbody tr th {\n",
+              "        vertical-align: top;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe thead th {\n",
+              "        text-align: right;\n",
+              "    }\n",
+              "</style>\n",
+              "<table border=\"1\" class=\"dataframe\">\n",
+              "  <thead>\n",
+              "    <tr style=\"text-align: right;\">\n",
+              "      <th></th>\n",
+              "      <th>tenureDay</th>\n",
+              "      <th>waiBondSubscore</th>\n",
+              "    </tr>\n",
+              "  </thead>\n",
+              "  <tbody>\n",
+              "    <tr>\n",
+              "      <th>count</th>\n",
+              "      <td>5311.000000</td>\n",
+              "      <td>5311.000000</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>mean</th>\n",
+              "      <td>6.460930</td>\n",
+              "      <td>3.836613</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>std</th>\n",
+              "      <td>3.892763</td>\n",
+              "      <td>0.768943</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>min</th>\n",
+              "      <td>4.000000</td>\n",
+              "      <td>1.000000</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>25%</th>\n",
+              "      <td>4.000000</td>\n",
+              "      <td>3.250000</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>50%</th>\n",
+              "      <td>5.000000</td>\n",
+              "      <td>4.000000</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>75%</th>\n",
+              "      <td>6.000000</td>\n",
+              "      <td>4.500000</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>max</th>\n",
+              "      <td>16.000000</td>\n",
+              "      <td>5.000000</td>\n",
+              "    </tr>\n",
+              "  </tbody>\n",
+              "</table>\n",
+              "</div>"
+            ],
+            "text/plain": [
+              "         tenureDay  waiBondSubscore\n",
+              "count  5311.000000      5311.000000\n",
+              "mean      6.460930         3.836613\n",
+              "std       3.892763         0.768943\n",
+              "min       4.000000         1.000000\n",
+              "25%       4.000000         3.250000\n",
+              "50%       5.000000         4.000000\n",
+              "75%       6.000000         4.500000\n",
+              "max      16.000000         5.000000"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 111
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "xOd1U1jdZU9S"
+      },
+      "source": [
+        "The Highest bond score is 5 and the lowest is 1.\n",
+        "\n",
+        "Let's check the mean average bond score by day:"
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/"
+        },
+        "id": "01if-0TI7gUT",
+        "outputId": "41b81f65-18ec-45fa-bc4f-83eb7e94aa45"
+      },
+      "source": [
+        "survey_responses.groupby(\"tenureDay\")[\"waiBondSubscore\"].mean()"
+      ],
+      "execution_count": null,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "text/plain": [
+              "tenureDay\n",
+              "4     3.812401\n",
+              "5     3.791287\n",
+              "6     3.755371\n",
+              "14    4.037109\n",
+              "15    4.046875\n",
+              "16    3.925725\n",
+              "Name: waiBondSubscore, dtype: float64"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 246
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "uhYziXFdZlMu"
+      },
+      "source": [
+        "Initial analysis of the mean score by tenure day, suggests that scores improve later in the tenure period, compared with the earlier days. It must be noted that we have previously seen the sample sizes for the days are very different.  "
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "qHs0tsaSb-e3"
+      },
+      "source": [
+        "# Task 1 - Does the reported measure of bond change over time?"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "9R3oqKy3s2LJ"
+      },
+      "source": [
+        "To measure whether bond changes over time, I will do the following:\n",
+        "\n",
+        "\n",
+        "1.   Pivot the surey_repsonses data set to observe which participants submitted two bond scores\n",
+        "2.   Add a column at the end of this pivot table, to calculate the change in bond score. This is calculated by deducting the first score from the second (where there are two)\n",
+        "3.   Calculating the mean of the 'Change' metric to understand the change in bond score over time\n",
+        "4.   Examine the distribution of users who submitted one bond score and those who submitted two\n"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "q10f77SilPtn"
+      },
+      "source": [
+        "The survey data is in long format, this can be pivotted."
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "l52ib8amAQGl"
+      },
+      "source": [
+        "# Pivot the dataframe to look at both scores for a given user, where applicable:\n",
+        "pivot_survey = survey_responses.pivot_table('waiBondSubscore', index =\"userid\", columns =\"tenureDay\") "
+      ],
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/",
+          "height": 235
+        },
+        "id": "ehPjtcZJBpks",
+        "outputId": "341e0731-777d-44e9-c7f0-c861671c9e5a"
+      },
+      "source": [
+        "pivot_survey.head(5)"
+      ],
+      "execution_count": null,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "text/html": [
+              "<div>\n",
+              "<style scoped>\n",
+              "    .dataframe tbody tr th:only-of-type {\n",
+              "        vertical-align: middle;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe tbody tr th {\n",
+              "        vertical-align: top;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe thead th {\n",
+              "        text-align: right;\n",
+              "    }\n",
+              "</style>\n",
+              "<table border=\"1\" class=\"dataframe\">\n",
+              "  <thead>\n",
+              "    <tr style=\"text-align: right;\">\n",
+              "      <th>tenureDay</th>\n",
+              "      <th>4</th>\n",
+              "      <th>5</th>\n",
+              "      <th>6</th>\n",
+              "      <th>14</th>\n",
+              "      <th>15</th>\n",
+              "      <th>16</th>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>userid</th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "    </tr>\n",
+              "  </thead>\n",
+              "  <tbody>\n",
+              "    <tr>\n",
+              "      <th>+/wAfc2I0c831C21wvh2Kcr4DZk=</th>\n",
+              "      <td>4.25</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>4.0</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0NdvBGRsXuoa20PHou4K3FMlBA=</th>\n",
+              "      <td>NaN</td>\n",
+              "      <td>3.75</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0eFEPPuFJm9U5lXwlAKw/I+Clo=</th>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>3.75</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0pfU/ormz318pPBTZ6cWtrgHkI=</th>\n",
+              "      <td>NaN</td>\n",
+              "      <td>5.00</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>5.0</td>\n",
+              "      <td>NaN</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+11s2fkg+oFKje/WvOYnzxbYgtY=</th>\n",
+              "      <td>4.50</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "    </tr>\n",
+              "  </tbody>\n",
+              "</table>\n",
+              "</div>"
+            ],
+            "text/plain": [
+              "tenureDay                       4     5     6    14   15  16\n",
+              "userid                                                      \n",
+              "+/wAfc2I0c831C21wvh2Kcr4DZk=  4.25   NaN   NaN  4.0  NaN NaN\n",
+              "+0NdvBGRsXuoa20PHou4K3FMlBA=   NaN  3.75   NaN  NaN  NaN NaN\n",
+              "+0eFEPPuFJm9U5lXwlAKw/I+Clo=   NaN   NaN  3.75  NaN  NaN NaN\n",
+              "+0pfU/ormz318pPBTZ6cWtrgHkI=   NaN  5.00   NaN  NaN  5.0 NaN\n",
+              "+11s2fkg+oFKje/WvOYnzxbYgtY=  4.50   NaN   NaN  NaN  NaN NaN"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 179
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "9HEW3PQVma1V"
+      },
+      "source": [
+        " Create a new column 'Change' to track the change in bond score over tenure days."
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "3AU28DfALIZi"
+      },
+      "source": [
+        "df = pivot_survey.reset_index(drop=True)\n",
+        "for index in df.index:\n",
+        "    row = df.iloc[index]\n",
+        "    nonNaValuesInRow = df.iloc[index].dropna()\n",
+        "    accumulated = np.nan\n",
+        "    for value in nonNaValuesInRow:      # Assumption that there are only 2 values (two timepoints)\n",
+        "      if len(nonNaValuesInRow) > 1:\n",
+        "        if (np.isnan(accumulated)): #first\n",
+        "            accumulated = value\n",
+        "        else:\n",
+        "           accumulated -= value #subtract value \n",
+        "        df.at[index,'Change'] =  accumulated\n",
+        "      else:\n",
+        "        df.at[index,'Change'] = float(\"NaN\")  # if there is only one bond score, then 'Change' is NaN"
+      ],
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "dtRUs_bPWy_X"
+      },
+      "source": [
+        "df[\"Change\"] = -df[\"Change\"] # swap the sign of last column to read more intuitively; negative indicates bond decreased, positive indicates that it increased\n",
+        "pivot_survey = pivot_survey.reset_index().rename({'index':'UserId'}, axis = 'columns')\n",
+        "newcolumn = pivot_survey[\"userid\"]\n",
+        "newdf = df.assign(UserId = newcolumn)\n",
+        "newdf = newdf.set_index('UserId')"
+      ],
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "nPCXbRZWkl0D",
+        "colab": {
+          "base_uri": "https://localhost:8080/",
+          "height": 235
+        },
+        "outputId": "dcb636fd-de78-4ea7-8424-7841fdc00158"
+      },
+      "source": [
+        "newdf.head(5)"
+      ],
+      "execution_count": null,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "text/html": [
+              "<div>\n",
+              "<style scoped>\n",
+              "    .dataframe tbody tr th:only-of-type {\n",
+              "        vertical-align: middle;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe tbody tr th {\n",
+              "        vertical-align: top;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe thead th {\n",
+              "        text-align: right;\n",
+              "    }\n",
+              "</style>\n",
+              "<table border=\"1\" class=\"dataframe\">\n",
+              "  <thead>\n",
+              "    <tr style=\"text-align: right;\">\n",
+              "      <th>tenureDay</th>\n",
+              "      <th>4</th>\n",
+              "      <th>5</th>\n",
+              "      <th>6</th>\n",
+              "      <th>14</th>\n",
+              "      <th>15</th>\n",
+              "      <th>16</th>\n",
+              "      <th>Change</th>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>UserId</th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "    </tr>\n",
+              "  </thead>\n",
+              "  <tbody>\n",
+              "    <tr>\n",
+              "      <th>+/wAfc2I0c831C21wvh2Kcr4DZk=</th>\n",
+              "      <td>4.25</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>4.0</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>-0.25</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0NdvBGRsXuoa20PHou4K3FMlBA=</th>\n",
+              "      <td>NaN</td>\n",
+              "      <td>3.75</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0eFEPPuFJm9U5lXwlAKw/I+Clo=</th>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>3.75</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0pfU/ormz318pPBTZ6cWtrgHkI=</th>\n",
+              "      <td>NaN</td>\n",
+              "      <td>5.00</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>5.0</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>-0.00</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+11s2fkg+oFKje/WvOYnzxbYgtY=</th>\n",
+              "      <td>4.50</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "    </tr>\n",
+              "  </tbody>\n",
+              "</table>\n",
+              "</div>"
+            ],
+            "text/plain": [
+              "tenureDay                        4     5     6   14   15  16  Change\n",
+              "UserId                                                              \n",
+              "+/wAfc2I0c831C21wvh2Kcr4DZk=  4.25   NaN   NaN  4.0  NaN NaN   -0.25\n",
+              "+0NdvBGRsXuoa20PHou4K3FMlBA=   NaN  3.75   NaN  NaN  NaN NaN     NaN\n",
+              "+0eFEPPuFJm9U5lXwlAKw/I+Clo=   NaN   NaN  3.75  NaN  NaN NaN     NaN\n",
+              "+0pfU/ormz318pPBTZ6cWtrgHkI=   NaN  5.00   NaN  NaN  5.0 NaN   -0.00\n",
+              "+11s2fkg+oFKje/WvOYnzxbYgtY=  4.50   NaN   NaN  NaN  NaN NaN     NaN"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 14
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "kLp-tekCxJ4d"
+      },
+      "source": [
+        "The distribution of biond score change across participants who logged two scores:"
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/",
+          "height": 295
+        },
+        "id": "mhLK_U7ftw7E",
+        "outputId": "e296dd61-b3e3-408a-c051-ff5875eb1e78"
+      },
+      "source": [
+        "sns.histplot(df[\"Change\"], color='red', alpha =0.5).set(title=\"Change metric distribution\")\n",
+        "plt.show()"
+      ],
+      "execution_count": null,
+      "outputs": [
+        {
+          "output_type": "display_data",
+          "data": {
+            "image/png": "iVBORw0KGgoAAAANSUhEUgAAAYUAAAEWCAYAAACJ0YulAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4yLjIsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy+WH4yJAAAazklEQVR4nO3de5QdZZ3u8e9DuCnoIKZPG4EYQPAMgwpMgxfILBREYFTEpVHiKHiLjDBHD44OiApnvM4oKMcLrCAMogRBgZHx4AgqSHQADTFCuKiAZJIYmgQQERBJeM4fVV1U2r3TO929d3Wnn89ae3XV+1bV/lUnXc+u65ZtIiIiADZruoCIiJg4EgoREVFJKERERCWhEBERlYRCRERUEgoREVFJKMSoSTpV0tebrmMikvQHSbuMw3Is6bnl8FmSPjL26kDSzLLGaeX4NZLeOR7LLpf3XUlHj9fyoncSCrFBkuZKWlRuQFaVf+wHNF1XUzrdeNre1vZd4/neto+1/bGRppN0t6SDR1jWf5c1rhtrXa0+HNg+zPZXx7rs6L2EQrQl6QTg88AngX5gJvBl4Igm65rIJG3edA0jmQw1RoNs55XXn72AvwD+ALxhA9OcClwMnA88BNwCDNT6TwTuLPtuBY6s9R0D/Bj4LPAA8BvgsFr/zsC15bzfB74EfL3W/2Lgv4DfAb8ADtxAnXcDHwBuAh4GzqEIue/Wlv+MkZYNfAJYB/yx/N18sWw3cBzwa+A3tbbnlsNPAU4DlgEPluv9lDa1fgBYBfwWePuw5ZwHfLwcng58p6zxfmAhxYe8rwFPAI+WNX4QmFUu5x3Af5e/16G2zcvlXQN8Cvgp8Hvg28D2Zd+BwIoWv9ODgUOBPwGPl+/3i9ry3lkObwZ8uFz/eyn+v/xF2TdUx9FlbWuAk5v+/z+VX40XkNfEfJV/7GuHNhptpjm13EAeDkwrNyrX1/rfADy73Ci8sdwgzyj7jik3JO8q5/37ckOosv86isDYEjig3FB9vezbAbivfN/NgFeU431t6rwbuJ4iCHYoN0yLgb2BrYEfAqd0suz6xq62fANXAdtTbuxZf2P+pXK+Hcp1fSmwVZvf+SCwJ7ANsID2ofAp4Cxgi/I1u/a7uxs4uLbcoQ3v+eVyn0LrUFhZe+9Lar/vA2kTCrX/B18f1l/9nijC7Q5gF2Bb4FLga8NqO7us64XAY8BfNv03MFVfOXwU7TwTWGN77QjT/dj2FS6OTX+N4o8aANvftP1b20/Yvojik/R+tXmX2T67nPerwAygX9JMYF/go7b/ZPvHwOW1+f4OuKJ83ydsXwUsotiQt/MF24O2V1J8qr7B9s9t/xG4jCIgRrtsgE/Zvt/2o/VGSZtRbBTfa3ul7XW2/8v2Yy2WMQf4N9tLbT9MsbFt53GK39dzbD9ue6HtkR5kdqrth4fXWPO12nt/BJgzdCJ6jN4MnG77Ltt/AE4C3jTsMNb/sf2o7V9Q7J29sNWCovsSCtHOfcD0Do4/31MbfgTYemgeSW+VtETS7yT9juJT6PRW89p+pBzclmLv4v5aG8Dy2vBzgDcMLbdc9gEUG8l2BmvDj7YY33YMyx5eX910ir2RO0eYH4r1ri9n2Qam/QzFp+8rJd0l6cQOlt+uxlb9yyj2QKa3mXZjPJv112UZsDnFntuQ4f+PtiUakVCIdq6j2I1/7WhmlvQcikMCxwPPtL0dsBRQB7OvAraX9NRa20614eUUn2q3q722sf3p0dQ6zEjLbvdpvF37GopDbLt28N6rWH89Z7ab0PZDtt9vexfgNcAJkg4aZY1Dhr/34xT1PwxU/xbl3kPfRiz3txRhW1/2WtYP5pggEgrRku0HgY8CX5L0WklPlbSFpMMk/WsHi9iGYmOxGkDS2yj2FDp572UUh2xOlbSlpJcAr65N8nXg1ZJeKWmapK0lHShpx41YxXZGWvYgxbHxjth+AjgXOF3Ss8tlvkTSVi0mvxg4RtIeZSCe0m65kl4l6bmSRHHyeh3FCeaNrrHm72rv/c/At8pDe7+i2AP8W0lbUJw0rtc/CMwqD5W1ciHwvyXtLGlbiqvZLurg0GQ0IKEQbdk+DTiBYiOwmuJT9PHAv3cw760UV9xcR7HReD7wk414+zcDL6E4jPVx4CKKPRdsL6e4LPZDtbo+wDj8f+5g2WcAr5f0gKT/2+Fi/xG4GfgZxZVC/9KqVtvfpbgE+IcUh4Z+uIFl7kZx1dQfKH7HX7Z9ddn3KeDD5eGvf+ywRijOCZ1HcShna+B/lXU9CLwH+ArFyeiHgRW1+b5Z/rxP0uIWyz23XPa1FFeZ/RH4h42oK3po6GqFiAlN0kXA7bbbfnqOiLHLnkJMSJL2lbSrpM0kHUrx6X3EPZSIGJvc2RgT1bMormd/JsWhir+3/fNmS4rY9HXt8JGknShulumnOOE43/YZkranOD48i+IGmDm2HyhPmJ1BcT34I8Axtlsdn4yIiC7p5uGjtcD7be9B8diA4yTtQfHogx/Y3g34QTkOcBjFybPdgHnAmV2sLSIiWuja4SPbqyiuu8b2Q5Juo7jN/wiK2+ahuIv1GuCfyvbzy7syr5e0naQZ5XJamj59umfNmtWtVYiI2CTdeOONa2z3terryTkFSbMoHiNwA9Bf29Dfw5N3Ne7A+ndUrijb1gsFSfMo9iSYOXMmixYt6lrdERGbIklt75bv+tVH5c0qlwDvs/37el+5V7BRJzVsz7c9YHugr69l0EVExCh1NRTKux8vAS6wfWnZPChpRtk/g+KJlVDcFFO/zX7Hsi0iInqka6FQXk10DnCb7dNrXZdTPDud8ue3a+1vVeHFwIMbOp8QERHjr5vnFPYH3gLcLGlJ2fYh4NPAxZLeQfG0xDll3xUUl6PeQXFJ6tu6WFtERLTQzauPfkz7J2IeNLyhPL9wXLfqiYiIkeUxFxERUUkoREREJaEQERGVhEJERFTylNSICeqQ2bNZM9j+Gyun9/dz5cKFPawopoKEQsQEtWZwkMVz57bt32fBgh5WE1NFDh9FREQloRAREZWEQkREVBIKERFRSShEREQloRAREZWEQkREVBIKERFRSShEREQloRAREZWEQkREVBIKERFR6VooSDpX0r2SltbaLpK0pHzdPfTdzZJmSXq01ndWt+qKiIj2uvmU1POALwLnDzXYfuPQsKTTgAdr099pe68u1hMRESPoWijYvlbSrFZ9kgTMAV7erfePiIiN19Q5hdnAoO1f19p2lvRzST+SNLvdjJLmSVokadHq1au7X2lExBTSVCgcBVxYG18FzLS9N3ACsEDS01vNaHu+7QHbA319fT0oNSJi6uh5KEjaHHgdcNFQm+3HbN9XDt8I3Ans3uvaIiKmuib2FA4Gbre9YqhBUp+kaeXwLsBuwF0N1BYRMaV185LUC4HrgOdJWiHpHWXXm1j/0BHA3wA3lZeofgs41vb93aotIiJa6+bVR0e1aT+mRdslwCXdqiUiIjqTO5ojIqKSUIiIiEpCISIiKgmFiIioJBQiIqKSUIiIiEpCISIiKgmFiIioJBQiIqKSUIiIiEpCISIiKgmFiIioJBQiIqKSUIiIiEpCISIiKgmFiIioJBQiIqKSUIiIiEo3v6P5XEn3SlpaaztV0kpJS8rX4bW+kyTdIemXkl7ZrboiIqK9bu4pnAcc2qL9c7b3Kl9XAEjaA3gT8FflPF+WNK2LtUVERAtdCwXb1wL3dzj5EcA3bD9m+zfAHcB+3aotIiJaa+KcwvGSbioPLz2jbNsBWF6bZkXZ9mckzZO0SNKi1atXd7vWiIgppdehcCawK7AXsAo4bWMXYHu+7QHbA319feNdX0TElLZ5L9/M9uDQsKSzge+UoyuBnWqT7li2RUxah8yezZrBwbb90/v7uXLhwh5WFDGynoaCpBm2V5WjRwJDVyZdDiyQdDrwbGA34Ke9rC1ivK0ZHGTx3Llt+/dZsKCH1UR0pmuhIOlC4EBguqQVwCnAgZL2AgzcDbwbwPYtki4GbgXWAsfZXtet2iIiorWuhYLto1o0n7OB6T8BfKJb9URExMhyR3NERFQSChERUUkoREREJaEQERGVhEJERFQSChERUUkoREREJaEQERGVhEJERFQSChERUUkoREREJaEQERGVhEJERFQSChERUUkoREREJaEQERGVhEJERFQSChERUelaKEg6V9K9kpbW2j4j6XZJN0m6TNJ2ZfssSY9KWlK+zupWXRER0V439xTOAw4d1nYVsKftFwC/Ak6q9d1pe6/ydWwX64qIiDa6Fgq2rwXuH9Z2pe215ej1wI7dev+IiNh4TZ5TeDvw3dr4zpJ+LulHkma3m0nSPEmLJC1avXp196uMiJhCGgkFSScDa4ELyqZVwEzbewMnAAskPb3VvLbn2x6wPdDX19ebgiMipoieh4KkY4BXAW+2bQDbj9m+rxy+EbgT2L3XtUVETHU9DQVJhwIfBF5j+5Fae5+kaeXwLsBuwF29rC0iImDzbi1Y0oXAgcB0SSuAUyiuNtoKuEoSwPXllUZ/A/yzpMeBJ4Bjbd/fcsEREdE1XQsF20e1aD6nzbSXAJd0q5aIqeiQ2bNZMzjYtn96fz9XLlzYw4piMuhaKEREs9YMDrJ47ty2/fssWNDDamKyyGMuIiKiklCIiIhKQiEiIioJhYiIqCQUIiKiklCIiIhKQiEiIioJhYiIqHQUCpL276QtIiImt073FL7QYVtERExiG3zMhaSXAC8F+iSdUOt6OjCtm4VFRETvjfTsoy2BbcvpnlZr/z3w+m4VFRERzdhgKNj+EfAjSefZXtajmiIioiGdPiV1K0nzgVn1eWy/vBtFRUREMzoNhW8CZwFfAdZ1r5yIiGhSp6Gw1vaZXa0kIiIa1+klqf8h6T2SZkjafujV1coiIqLnOt1TOLr8+YFam4FdNjSTpHOBVwH32t6zbNseuIji/MTdwBzbD6j40uYzgMOBR4BjbC/usL6Inhvp6y5XLl/ew2oixkdHoWB751Eu/zzgi8D5tbYTgR/Y/rSkE8vxfwIOA3YrXy8Czix/RkxII33d5fRPfrKH1USMj45CQdJbW7XbPr9Ve63/WkmzhjUfARxYDn8VuIYiFI4Azrdt4HpJ20maYXtVJzVGRMTYdXr4aN/a8NbAQcBi1t8D6FR/bUN/D9BfDu8A1Pe3V5Rt64WCpHnAPICZM2eO4u0jIqKdTg8f/UN9XNJ2wDfG+ua2LckbOc98YD7AwMDARs0bEREbNtpHZz8MjPY8w6CkGQDlz3vL9pXATrXpdizbIiKiRzo9p/AfFFcbQfEgvL8ELh7le15OcTXTp8uf3661Hy/pGxQnmB/M+YSIiN7q9JzCZ2vDa4FltleMNJOkCylOKk+XtAI4hSIMLpb0DmAZMKec/AqKy1HvoLgk9W0d1hYREeOk03MKP5LUz5MnnH/d4XxHtek6qMW0Bo7rZLkREdEdnX7z2hzgp8AbKD7Z3yApj86OiNjEdHr46GRgX9v3AkjqA74PfKtbhUVERO91evXRZkOBULpvI+aNiIhJotM9hf+U9D3gwnL8jRQnhiMiYhMy0nc0P5fiDuQPSHodcEDZdR1wQbeLi4iI3hppT+HzwEkAti8FLgWQ9Pyy79VdrS4iInpqpPMC/bZvHt5Yts3qSkUREdGYkUJhuw30PWU8C4mIiOaNFAqLJL1reKOkdwI3dqekiIhoykjnFN4HXCbpzTwZAgPAlsCR3SwsIiJ6b4OhYHsQeKmklwF7ls3/z/YPu15ZRET0XKfPProauLrLtURERMNyV3JERFQSChERUUkoREREJaEQERGVhEJERFQSChERUen00dnjRtLzgItqTbsAH6V4pMa7gNVl+4ds5/HcERE91PNQsP1LYC8ASdOAlcBlwNuAz9n+bK9rioiIQtOHjw4C7rS9rOE6IiKC5kPhTTz5bW4Ax0u6SdK5kp7RagZJ8yQtkrRo9erVrSaJiIhRaiwUJG0JvAb4Ztl0JrArxaGlVcBpreazPd/2gO2Bvr6+ntQaETFVNLmncBiwuHzoHrYHba+z/QRwNrBfg7VFRExJPT/RXHMUtUNHkmbYXlWOHgksbaSqiCli+fLl7LP77m37p/f3c+XChT2sKCaCRkJB0jbAK4B315r/VdJegIG7h/VFxDjzunUsnju3bf8+Cxb0sJqYKBoJBdsPA88c1vaWJmqJiIgnNX31UURETCBNnlOIaNQhs2ezZnCwbX+OqcdUlFCIKWvN4GCOqUcMk8NHERFRSShEREQloRAREZWEQkREVBIKERFRSShEREQloRAREZWEQkREVHLzWkSMSu4I3zQlFCJiVHJH+KYph48iIqKSUIiIiEpCISIiKgmFiIioJBQiIqLS2NVHku4GHgLWAWttD0jaHrgImEXxPc1zbD/QVI0REVNN03sKL7O9l+2BcvxE4Ae2dwN+UI5HRESPNB0Kwx0BfLUc/irw2gZriYiYcpoMBQNXSrpR0ryyrd/2qnL4HqC/mdIiIqamJu9oPsD2Skn/A7hK0u31TtuW5OEzlQEyD2DmzJm9qTQiYopobE/B9sry573AZcB+wKCkGQDlz3tbzDff9oDtgb6+vl6WHBGxyWskFCRtI+lpQ8PAIcBS4HLg6HKyo4FvN1FfRMRU1dTho37gMklDNSyw/Z+SfgZcLOkdwDJgTkP1xSSQp3RGjL9GQsH2XcALW7TfBxzU+4piMspTOiPG30S7JDUiIhqUUIiIiEpCISIiKgmFiIioJBQiIqKSUIiIiEpCISIiKgmFiIioJBQiIqKSUIiIiEpCISIiKgmFiIioJBQiIqKSUIiIiEpCISIiKgmFiIioJBQiIqKSUIiIiEpCISIiKj0PBUk7Sbpa0q2SbpH03rL9VEkrJS0pX4f3uraIiKlu8wbecy3wftuLJT0NuFHSVWXf52x/toGaIiKCBkLB9ipgVTn8kKTbgB16XUdERPy5JvYUKpJmAXsDNwD7A8dLeiuwiGJv4oEW88wD5gHMnDmzZ7VG7x0yezZrBgfb9q9cvryH1cR4G+nfd3p/P1cuXNjDigIaDAVJ2wKXAO+z/XtJZwIfA1z+PA14+/D5bM8H5gMMDAy4dxVHr60ZHGTx3Llt+6d/8pM9rCbG20j/vvssWNDDamJII1cfSdqCIhAusH0pgO1B2+tsPwGcDezXRG0REVNZE1cfCTgHuM326bX2GbXJjgSW9rq2iIipronDR/sDbwFulrSkbPsQcJSkvSgOH90NvLuB2iIiprQmrj76MaAWXVf0upborpxIjJh8Gr36KDZtOZEYMfnkMRcREVFJKERERCWhEBERlYRCRERUEgoREVFJKERERCWXpEbEhLR8+XL22X33tv25z6U7EgoRMSF53brc59KAHD6KiIhKQiEiIioJhYiIqOScwhSWB9ZFtDdV/z4SClNYHlgXm7KxbtSn6t9HQiHayiWBMZlN1Y36WCUUoq1cEhgx9eREc0REVBIKERFRmXCHjyQdCpwBTAO+YvvTDZc0YU3VqyMiJoJN9ZzbhAoFSdOALwGvAFYAP5N0ue1bm61sYsqJtIjmbKrn3CZUKAD7AXfYvgtA0jeAI4CuhEK3P2mPtPx7Bgd5Vn9/194/Iiavpo4EyPa4L3S0JL0eONT2O8vxtwAvsn18bZp5wLxy9HnAL3tc5nRgTY/fs9uyTpND1mnimyzr8xzbfa06JtqewohszwfmN/X+khbZHmjq/bsh6zQ5ZJ0mvk1hfSba1UcrgZ1q4zuWbRER0QMTLRR+BuwmaWdJWwJvAi5vuKaIiCljQh0+sr1W0vHA9yguST3X9i0NlzVcY4euuijrNDlknSa+Sb8+E+pEc0RENGuiHT6KiIgGJRQiIqKSUBgFSR+TdJOkJZKulPTspmsaC0mfkXR7uU6XSdqu6ZrGStIbJN0i6QlJk/oSQUmHSvqlpDskndh0PWMl6VxJ90pa2nQt40XSTpKulnRr+f/uvU3XNFoJhdH5jO0X2N4L+A7w0aYLGqOrgD1tvwD4FXBSw/WMh6XA64Brmy5kLGqPfjkM2AM4StIezVY1ZucBhzZdxDhbC7zf9h7Ai4HjJuu/U0JhFGz/vja6DTCpz9bbvtL22nL0eor7QyY127fZ7vXd7t1QPfrF9p+AoUe/TFq2rwXub7qO8WR7le3F5fBDwG3ADs1WNToT6pLUyUTSJ4C3Ag8CL2u4nPH0duCipouIyg7A8tr4CuBFDdUSHZA0C9gbuKHZSkYnodCGpO8Dz2rRdbLtb9s+GThZ0knA8cApPS1wI420PuU0J1PsBl/Qy9pGq5N1iuglSdsClwDvG3ZEYdJIKLRh++AOJ70AuIIJHgojrY+kY4BXAQd5kty8shH/RpNZHv0ySUjagiIQLrB9adP1jFbOKYyCpN1qo0cAtzdVy3gov9jog8BrbD/SdD2xnjz6ZRKQJOAc4Dbbpzddz1jkjuZRkHQJxWO7nwCWAcfanrSf3iTdAWwF3Fc2XW/72AZLGjNJRwJfAPqA3wFLbL+y2apGR9LhwOd58tEvn2i4pDGRdCFwIMVjpgeBU2yf02hRYyTpAGAhcDPFdgHgQ7avaK6q0UkoREREJYePIiKiklCIiIhKQiEiIioJhYiIqCQUIiKikpvXIoaR9CyKS0D3pbicdRD4d4r7OF7VZG0R3ZY9hYia8iaky4BrbO9q+68pnhrb32xlEb2RUIhY38uAx22fNdRg+xcUNyZtK+lb5XdPXFAGCJI+KulnkpZKml9rv0bSv0j6qaRfSZpdtj9V0sXls/cvk3TD0Hc+SDpE0nWSFkv6ZvksnYieSShErG9P4MY2fXsD76P4XoNdgP3L9i/a3tf2nsBTKJ4hNWRz2/uV8w09H+s9wAPls/c/Avw1gKTpwIeBg23vAywCThivFYvoREIhonM/tb3C9hPAEmBW2f6y8tP+zcDLgb+qzTP0YLQba9MfQPG9CNheCtxUtr+YInB+ImkJcDTwnO6sSkRrOdEcsb5bgNe36XusNrwO2FzS1sCXgQHbyyWdCmzdYp51jPz3JuAq20dtdNUR4yR7ChHr+yGwlaR5Qw2SXgDMbjP9UACsKY//twuUup8Ac8pl7wE8v2y/Hthf0nPLvm0k7b7xqxAxegmFiJryuySOBA6WdKekW4BPAfe0mf53wNkU3wn9PYpHXY/ky0CfpFuBj1PsnTxoezVwDHChpJuA64D/ObY1itg4eUpqRI9JmgZsYfuPknYFvg88r/wO5ohG5ZxCRO89Fbi6/KYuAe9JIMREkT2FiIio5JxCRERUEgoREVFJKERERCWhEBERlYRCRERU/j9ZHcpv38bZbQAAAABJRU5ErkJggg==\n",
+            "text/plain": [
+              "<Figure size 432x288 with 1 Axes>"
+            ]
+          },
+          "metadata": {
+            "tags": [],
+            "needs_background": "light"
+          }
+        }
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/"
+        },
+        "id": "aeEGEs1_Wy4s",
+        "outputId": "a048d0ba-3a66-47fc-8aa1-64043fa622b5"
+      },
+      "source": [
+        "df[\"Change\"].mean()"
+      ],
+      "execution_count": null,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "text/plain": [
+              "-0.11161670235546038"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 186
+        }
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/"
+        },
+        "id": "D7A_IYtyugHR",
+        "outputId": "fb287ea4-edd2-4616-a7e5-83abf524842e"
+      },
+      "source": [
+        "# Number of users with one bond score and no change tracked\n",
+        "len(newdf[newdf['Change'].isna()])"
+      ],
+      "execution_count": null,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "text/plain": [
+              "3443"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 192
+        }
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/"
+        },
+        "id": "f1TD_lC5ugN6",
+        "outputId": "cef23484-62ac-4bf3-b763-37f89870b01c"
+      },
+      "source": [
+        "# Number of users with two bond scores and where change could be tracked\n",
+        "len(newdf[newdf['Change'].notna()])"
+      ],
+      "execution_count": null,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "text/plain": [
+              "934"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 193
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "e4YzH6nwW1jy"
+      },
+      "source": [
+        "# Results\n"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "D80qjpZO-KTE"
+      },
+      "source": [
+        "On average, where there are two bond scores submitted by the user, the bond increases by **0.11** between the first and second score.\n",
+        "\n",
+        "It must be noted that in 3443 cases the participant recorded an initial bond score, but no subseqent one. Only in 935 out of the 4377 users recorded two bond scores."
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "ES6GqMvoTEFG"
+      },
+      "source": [
+        "Is there a pattern between those who submitted only one bond score and those who submitted two?\n",
+        "\n",
+        "Let's look at the distribution of average scores for these two groups, by tenure day:"
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "bI4UJbtNeYLf"
+      },
+      "source": [
+        "OneScore = newdf[newdf['Change'].isna()]"
+      ],
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "dtw_79eaWUbg"
+      },
+      "source": [
+        "TwoScores = newdf[newdf['Change'].notna()]"
+      ],
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/"
+        },
+        "id": "-hYq2yGgYGG2",
+        "outputId": "a00ec1c7-84c1-438b-a71a-875fe45d1e31"
+      },
+      "source": [
+        "print(\"Mean bond scores for users who submitted one score:\")\n",
+        "print(OneScore[[4, 5, 6, 14, 15, 16, 'Change']].mean())\n",
+        "print(\"Mean bond scores for users who submitted two scores:\")\n",
+        "print(TwoScores[[4, 5, 6, 14, 15, 16, 'Change']].mean())"
+      ],
+      "execution_count": null,
+      "outputs": [
+        {
+          "output_type": "stream",
+          "text": [
+            "Mean bond scores for users who submitted one score:\n",
+            "tenureDay\n",
+            "4         3.780131\n",
+            "5         3.756394\n",
+            "6         3.742317\n",
+            "14             NaN\n",
+            "15        4.312500\n",
+            "16             NaN\n",
+            "Change         NaN\n",
+            "dtype: float64\n",
+            "Mean bond scores for users who submitted two scores:\n",
+            "tenureDay\n",
+            "4         3.920115\n",
+            "5         3.924390\n",
+            "6         3.817416\n",
+            "14        4.037109\n",
+            "15        4.044296\n",
+            "16        3.925725\n",
+            "Change    0.111617\n",
+            "dtype: float64\n"
+          ],
+          "name": "stdout"
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "eyLQWa2kIIxE"
+      },
+      "source": [
+        "The partcipants who submitted a second score, on average had slightly higher early bond scores, compared to those who didn't.\n",
+        "\n",
+        "There are 4 instances of outlier participants who submitted their only bond score on day 15, but did not submit an early one on days 4,5 or 6.\n",
+        "\n",
+        "Whilst the sample sizes are different, willingness to submit a second score may suggest a level of engagement."
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "U2lAx_XKb_u-"
+      },
+      "source": [
+        "# Task 2 - Is Bond dependent on engagement / activity?"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "A7frHyEMvqHP"
+      },
+      "source": [
+        "To attempt to answer this question I will implement the following tests:\n",
+        "\n",
+        "\n",
+        "1.   Pivot the user_activity data to reorganise with the tenure day as columns. Fill the Nan cells with 0s for ease of analysis.\n",
+        "2.   Add a column to the pivotted table with the mean number of user messages for the 28 day period for each user\n",
+        "3.   Develop a visual to understand the trend in user engagement\n",
+        "4.   Test the correlation between early bond score (days 4-6) and messages sent days 0-6 for a relationship between message volumes and bond levels\n",
+        "5.   Test the correlation between change in bond score and messages sent days 0-28 for a relationship between message volumes and change in bond\n",
+        "6.   Statistical test to gauge if there is a difference in engagement levels (messages sent) between users who reorded low bond scores and high bond scores\n",
+        "\n"
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/",
+          "height": 204
+        },
+        "id": "YiCK17wnfLKA",
+        "outputId": "0bf0dafb-1df4-4dfd-d2e5-e146c89a07cc"
+      },
+      "source": [
+        "user_activty.head(5)"
+      ],
+      "execution_count": null,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "text/html": [
+              "<div>\n",
+              "<style scoped>\n",
+              "    .dataframe tbody tr th:only-of-type {\n",
+              "        vertical-align: middle;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe tbody tr th {\n",
+              "        vertical-align: top;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe thead th {\n",
+              "        text-align: right;\n",
+              "    }\n",
+              "</style>\n",
+              "<table border=\"1\" class=\"dataframe\">\n",
+              "  <thead>\n",
+              "    <tr style=\"text-align: right;\">\n",
+              "      <th></th>\n",
+              "      <th>userid</th>\n",
+              "      <th>tenureDay</th>\n",
+              "      <th>userMessages</th>\n",
+              "      <th>moodCategory</th>\n",
+              "    </tr>\n",
+              "  </thead>\n",
+              "  <tbody>\n",
+              "    <tr>\n",
+              "      <th>0</th>\n",
+              "      <td>rLzw2UmRCEe46MtW5gES+bx5uRU=</td>\n",
+              "      <td>0</td>\n",
+              "      <td>45</td>\n",
+              "      <td>neutral</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>1</th>\n",
+              "      <td>V0EzPowhWQCxtw1Xtxv2l9RrJ0k=</td>\n",
+              "      <td>0</td>\n",
+              "      <td>70</td>\n",
+              "      <td>NaN</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>2</th>\n",
+              "      <td>bNQ0Y1NqoS4K4jwNTOQlR1dJHlQ=</td>\n",
+              "      <td>0</td>\n",
+              "      <td>83</td>\n",
+              "      <td>NaN</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>3</th>\n",
+              "      <td>6nO/an2GbB8cg/dDVm0qzc5kfag=</td>\n",
+              "      <td>0</td>\n",
+              "      <td>61</td>\n",
+              "      <td>NaN</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>4</th>\n",
+              "      <td>JM3fV1nBKwLHxhduyB8Are4RTAQ=</td>\n",
+              "      <td>0</td>\n",
+              "      <td>93</td>\n",
+              "      <td>negative</td>\n",
+              "    </tr>\n",
+              "  </tbody>\n",
+              "</table>\n",
+              "</div>"
+            ],
+            "text/plain": [
+              "                         userid  tenureDay  userMessages moodCategory\n",
+              "0  rLzw2UmRCEe46MtW5gES+bx5uRU=          0            45      neutral\n",
+              "1  V0EzPowhWQCxtw1Xtxv2l9RrJ0k=          0            70          NaN\n",
+              "2  bNQ0Y1NqoS4K4jwNTOQlR1dJHlQ=          0            83          NaN\n",
+              "3  6nO/an2GbB8cg/dDVm0qzc5kfag=          0            61          NaN\n",
+              "4  JM3fV1nBKwLHxhduyB8Are4RTAQ=          0            93     negative"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 221
+        }
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "iVz0pnt8fo0y"
+      },
+      "source": [
+        "pivot_activity = user_activty.pivot_table('userMessages', index =\"userid\", columns =\"tenureDay\") "
+      ],
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "3emqEyyt5nxO"
+      },
+      "source": [
+        "pivot_activity = pivot_activity.fillna(0)"
+      ],
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/",
+          "height": 235
+        },
+        "id": "8ce4e5aoD8SZ",
+        "outputId": "cf324f54-3694-4359-8ff7-0c0e06614291"
+      },
+      "source": [
+        "pivot_activity.head(5)"
+      ],
+      "execution_count": null,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "text/html": [
+              "<div>\n",
+              "<style scoped>\n",
+              "    .dataframe tbody tr th:only-of-type {\n",
+              "        vertical-align: middle;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe tbody tr th {\n",
+              "        vertical-align: top;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe thead th {\n",
+              "        text-align: right;\n",
+              "    }\n",
+              "</style>\n",
+              "<table border=\"1\" class=\"dataframe\">\n",
+              "  <thead>\n",
+              "    <tr style=\"text-align: right;\">\n",
+              "      <th>tenureDay</th>\n",
+              "      <th>0</th>\n",
+              "      <th>1</th>\n",
+              "      <th>2</th>\n",
+              "      <th>3</th>\n",
+              "      <th>4</th>\n",
+              "      <th>5</th>\n",
+              "      <th>6</th>\n",
+              "      <th>7</th>\n",
+              "      <th>8</th>\n",
+              "      <th>9</th>\n",
+              "      <th>10</th>\n",
+              "      <th>11</th>\n",
+              "      <th>12</th>\n",
+              "      <th>13</th>\n",
+              "      <th>14</th>\n",
+              "      <th>15</th>\n",
+              "      <th>16</th>\n",
+              "      <th>17</th>\n",
+              "      <th>18</th>\n",
+              "      <th>19</th>\n",
+              "      <th>20</th>\n",
+              "      <th>21</th>\n",
+              "      <th>22</th>\n",
+              "      <th>23</th>\n",
+              "      <th>24</th>\n",
+              "      <th>25</th>\n",
+              "      <th>26</th>\n",
+              "      <th>27</th>\n",
+              "      <th>28</th>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>userid</th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "    </tr>\n",
+              "  </thead>\n",
+              "  <tbody>\n",
+              "    <tr>\n",
+              "      <th>+/wAfc2I0c831C21wvh2Kcr4DZk=</th>\n",
+              "      <td>33.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>30.0</td>\n",
+              "      <td>24.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>29.0</td>\n",
+              "      <td>37.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>19.0</td>\n",
+              "      <td>22.0</td>\n",
+              "      <td>46.0</td>\n",
+              "      <td>23.0</td>\n",
+              "      <td>106.0</td>\n",
+              "      <td>23.0</td>\n",
+              "      <td>19.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>15.0</td>\n",
+              "      <td>19.0</td>\n",
+              "      <td>54.0</td>\n",
+              "      <td>33.0</td>\n",
+              "      <td>14.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>33.0</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0NdvBGRsXuoa20PHou4K3FMlBA=</th>\n",
+              "      <td>54.0</td>\n",
+              "      <td>30.0</td>\n",
+              "      <td>22.0</td>\n",
+              "      <td>7.0</td>\n",
+              "      <td>7.0</td>\n",
+              "      <td>58.0</td>\n",
+              "      <td>5.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>22.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0eFEPPuFJm9U5lXwlAKw/I+Clo=</th>\n",
+              "      <td>51.0</td>\n",
+              "      <td>150.0</td>\n",
+              "      <td>126.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>63.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>86.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0pfU/ormz318pPBTZ6cWtrgHkI=</th>\n",
+              "      <td>103.0</td>\n",
+              "      <td>74.0</td>\n",
+              "      <td>11.0</td>\n",
+              "      <td>37.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>64.0</td>\n",
+              "      <td>67.0</td>\n",
+              "      <td>19.0</td>\n",
+              "      <td>51.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>50.0</td>\n",
+              "      <td>22.0</td>\n",
+              "      <td>57.0</td>\n",
+              "      <td>47.0</td>\n",
+              "      <td>9.0</td>\n",
+              "      <td>43.0</td>\n",
+              "      <td>15.0</td>\n",
+              "      <td>18.0</td>\n",
+              "      <td>23.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>40.0</td>\n",
+              "      <td>2.0</td>\n",
+              "      <td>26.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>9.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>56.0</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+11s2fkg+oFKje/WvOYnzxbYgtY=</th>\n",
+              "      <td>65.0</td>\n",
+              "      <td>32.0</td>\n",
+              "      <td>11.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>48.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>2.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>8.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "    </tr>\n",
+              "  </tbody>\n",
+              "</table>\n",
+              "</div>"
+            ],
+            "text/plain": [
+              "tenureDay                        0      1      2     3   ...    25   26    27    28\n",
+              "userid                                                   ...                       \n",
+              "+/wAfc2I0c831C21wvh2Kcr4DZk=   33.0    0.0    0.0  30.0  ...  25.0  0.0  25.0  33.0\n",
+              "+0NdvBGRsXuoa20PHou4K3FMlBA=   54.0   30.0   22.0   7.0  ...   0.0  0.0   0.0   0.0\n",
+              "+0eFEPPuFJm9U5lXwlAKw/I+Clo=   51.0  150.0  126.0   0.0  ...   0.0  0.0   0.0   0.0\n",
+              "+0pfU/ormz318pPBTZ6cWtrgHkI=  103.0   74.0   11.0  37.0  ...   0.0  9.0   0.0  56.0\n",
+              "+11s2fkg+oFKje/WvOYnzxbYgtY=   65.0   32.0   11.0   0.0  ...   0.0  0.0   0.0   0.0\n",
+              "\n",
+              "[5 rows x 29 columns]"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 117
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "SxtVDVE_rOhf"
+      },
+      "source": [
+        "Add a column with the mean number of daily messages for the period:"
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "3JNkfz7ZMKHm"
+      },
+      "source": [
+        "pivot_averages = pivot_activity.append(pivot_activity.mean(numeric_only=True), ignore_index=True)"
+      ],
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "foBPqhJ8raQ9"
+      },
+      "source": [
+        "We can see in the visual below that the average number of messages sent per user drops significantly after the first day, from 80.5 messages per user on Day 0 to 43.5 ,essages per ueser on day 1."
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "HSy-bKGrMRqE"
+      },
+      "source": [
+        "plotdfavg = pivot_averages.iloc[-1]"
+      ],
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "STBQ4PONRG5r"
+      },
+      "source": [
+        "plotdfavg.reset_index\n",
+        "plotdfavg = pd.DataFrame(plotdfavg)\n",
+        "plotdfavg[\"Tenure_Days\"] = plotdfavg.index\n",
+        "plotdfavg.rename(columns={4377: 'Average_Messages'}, inplace=True)\n",
+        "plotdfavg.head()"
+      ],
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/",
+          "height": 385
+        },
+        "id": "M7sz40--Muj7",
+        "outputId": "9a54785c-413f-42ac-9308-1b0291e5a972"
+      },
+      "source": [
+        "sns.displot(plotdfavg, x = plotdfavg[\"Tenure_Days\"], y=plotdfavg[\"Average_Messages\"], bins = 29, color='blue', alpha = .5, legend=False).set(title='Average Messages Received by Tenure day')\n",
+        "plt.show()"
+      ],
+      "execution_count": null,
+      "outputs": [
+        {
+          "output_type": "display_data",
+          "data": {
+            "image/png": "iVBORw0KGgoAAAANSUhEUgAAAWAAAAFwCAYAAACGt6HXAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4yLjIsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy+WH4yJAAAgAElEQVR4nO3deZhcZZn+8e9Nwg5C0CYGwiaijDBstijjhkYURQ06GEGWiCjyGxeYxQEcFRxxBkYRZ8YRCYIEZIugEFFZjAg6MyJNCFvAIUIEYpYOEgk7hOf3x/sWKdteTid9+q2qvj/X1VedOkud59SpvuvUezZFBGZmNvrWKV2AmdlY5QA2MyvEAWxmVogD2MysEAewmVkhDmAzs0IcwGYjQNKhkq6t4XX3lfTQIMND0stHer7tRtL2+b0YX7qW4XAAN5H0c0mPSFq/dC1rS9LJ+QN5bJ/+x+b+JxcqrXaSPixplaTHJD0q6TZJ765znhFxYUS8vc551EXSZ/N79Zikp5reu8ck3VW6vk7mAM4kbQ+8EQjgvTW8folv5v8DjujTb3ru3+n+NyI2ATYHvglcImnzwjW1pIj4l4jYJL9fx5Dfu/y3y2jU0G5briPFAbzaEcCvgPNIIYWk9SWtkLRrYyRJXZKelLRlfv5uSfPyeP8jabemcRdKOl7S7cDjksZLOkHSbyWtlDRf0vuaxh8n6XRJyyXdL+mTzT+rJG0m6RxJiyUtknSKpHGDLNPNwEaSdsnT7wJskPu/YIhlOD7Pa6Wk30iakvvvLaknb2EulfS1pmm+J2mJpD9KurEx/zzsxZJ+mKe7OS/DL5uG7yzpOkl/yPOb1jTsXfk9W5lr+odB1ygQEc8DFwAbAzvl11lf0lclPZBr/5akDZvmMzW/H4/mdbX/UO9/3ur+Ze4+U9JX+7zHV0r6u9y9laTLJfXm9fzppvE2lHRe/iU2H3jNUMsIvEvSfflz8xVJ60haL7+Hf9n02ltKekJSV4XXbEwz2Po4T9J/SfpRXic3SdoxD/uzJgGlX5gfbXq//lvSGZIeBk4ear30qWtcHne5pPuAA/oMP1LS3bmu+yR9vGnYnZLe0/R83fw6e1Z9X0ZMRPgvnY69APgb4NXAs8DE3P9c4MtN430CuDp37wksA14LjCMF90Jg/Tx8ITAP2AbYMPf7ALAV6cvvg8DjwKQ87BhgPjAZmAD8lLRFPj4P/wFwFilMtgR+DXx8gOU5Gfgu8FngtNzv34ATc/+Th1oG4JXAg8BWedztgR1z9/8Ch+fuTYDXNc37I8Cm+TW+DsxrGnZJ/tsIeFV+/V/mYRvn50cC43Nty4FX5eGLgTfm7gnAXgMs+4ebXnNcXmfPAFvmfmcAs4Etcp0/BP41D9sb+COwX15HWwM7D/X+95nnm/JyqKnWJ5vW+y3AF4D1gJcB9wHvyOOeCvwi17YNcCfw0CCf2wCuz+NvS/p189E87JuNdZ+fHwv8cIj/g+blGGp9nAc8nN+z8cCFwCVNn5UXPru538+bavsw8BzwqTzthoOtl37qPAa4J79HW+T3oPl/5QBgR0DAm4EnGp8X4B+BS5teaypwR5HcKRV4rfQHvIEUui/Jz+8B/jZ3vw34bdO4/w0ckbvPBL7U57V+A7w5dy8EPjLEvOcBU3P3z2gK1DzvyB/QicDT5CDPww8Brh/gdU8mBe22wAPAuvlxG/40gAdcBuDlpHB+G7Bun3FuBL7YeM8GWb7N8zJsRgrDZ4FXNg0/hdX/8B8EftFn+rOAk3L3A8DHgRcNMc/GP/eKPL8ngWl5mEhfejs2jb8PcH/T/M7o5zUHff/50+BSrvVN+fnHgJ/l7tcCD/R57ROB7+Tu+4D9m4YdzdAB3Dz+3wBzmufF6i+Cnsb7MMR7V3V9nAd8u2nYu4B7cvf2DB3ADzQNG3S99FPnz4Bjmp6/ve/8+ox/BXBs7t4KWNn4HAGXAf842PtS15+bIJLpwLURsTw/vyj3g/TNupGk1yq1E+9B2hIC2A74+/zTfYWkFaSA26rptR9snpGkI5p+7q8AdgVekgdv1Wf85u7tSCG6uGnas0hbYgOKiAdIW/f/AtwbEQ/2GWXAZYiIBcBxpDBfJukSSY1lOwp4BXBPbkp4d16+cZJOzT/dHyV9CZGXsYv0ZTLYMr62Ty2HAi/Nw/+a9E/+O0k3SNpnkEX/VURsTtr6nE1q3yfXsBFwS9M8rs79ycv+235er/L7H+m/+hJSQAN8iLR12Hidrfos42dJAQ9//hn43SDL2NB3/K1yHTeRtvz2lbQz6Qt1doXXaxhqfQAsaep+gvRrqKrmuodaL30N+j5JeqekX+WmkxWkz81LACLi96QNqb9W2i/wTlavn1E1Jhu+m+U2pmnAOEmND9P6wOaSdo+I2yTNIv0zLQWuioiVebwHSc0TXx5kFi9cbk7SdsDZwBTSjo5VkuaRvv0h/cSe3DTtNk3dD5K2wF4SEc8NczHPJzWlHNnPsEGXISIuAi6S9CJS4JxGanq4FzhE0jrA+4HLJL04d08lbTUvJG35PpKXsZe0ZTqZ1TsC+y7jDRGx3wC13AxMlbQu8ElgVp/p+5vmMUn/D7hP0rnAbaQt4l0iYtEA78eOA/Qfzvt/MXCtpFNJW6KNtv4HSVt1Ow0w3WLSMjWOPti2wrz6jv/7pmEzgcNIQXlZRDxV4fUaBl0fQ3g8P24EPJq7X9pnnOZLMS5n8PXSV+N9anjhfVI6iuly0n6dKyPiWUlXsPr/DNL78lFSBv5vxXmOOG8Bw4HAKlJ75B757y9I7XCNIwguIv0cOzR3N5wNHJO3jiVpY0kHSNp0gHltTPrQ9ULaUUDaAm6YBRwraev8zXx8Y0BELAauBU6X9KK8o2VHSW+usIyXkn6izepn2IDLIOmVkt6aP9BPkf5Bns+1HyapK9JOrhX5tZ4ntd09TWob3Ii05d1YhlXA90k7XDbKW2XNR2lcBbxC0uF5x8i6kl4j6S+UdiodKmmziHiW9E/9fIVlJyL+AHwb+EKu92zgDK3ekbq1pHfk0c8BjpQ0Jb/HW0vaebjvf0TcSgqVbwPXRETjPfo1sFJp5+aG+RfDrpIaO9tmASdKmiBpMqmNdCifyeNvQ2rnvbRp2HdJ4X8Y6Yt4OAZcH0NNGBG9wCLgsLyMH6H/L7bG+EOtl75mAZ+WNFnSBOCEpmHrkTaieoHnJL2T9PlvdgWwF+n9Gu77MmIcwKmp4TsR8UBELGn8Ad8ADpU0Pv+Ue5z0s+cnjQkjoofUvvcN0lbeAlLbVr8iYj5wOmkH1lLgL0k/hRrOJv2T3w7cCvyYtMW4Kg8/gvThmp/ndxkwaagFjIgnI+KnEfFkP8MGW4b1STuFlpO2oLYktVcC7A/cJekx4N+Bg/Prn0/6Obgo1/mrPrP8JGmreAnp6ISLSYFN/mXxduBg0lbcEtIWd+O47MOBhblp4xjSF2JVXycdLbAb6YttAfCr/Fo/Je1wJCJ+TfqlcAZpZ9wNpJ/iMPz3/yLSL4EXvrTzl9C7SV/097M6pDfLo3yR9P7dT/osXFBh2a4k7dibB/yI9CXSmN+DwFzSF/8vKrzWCyqsj6F8DPgM6ct4F+B/hhh/wPXSj7OBa0i/aOaSvtib6/40KaQfITUB/UnTS/6sXg7s0DztaGs0zlsLyt/c34qI7YYcuU1JOg14aURMH3JkWyO56eX3EfG50rW0EklfAF4REYeVqmHMtwG3ktwe/RbSls9E4CRW7/DrCLnZYT3gDtIxrkeR2uKsBko7jt9POoTMMklbkD57h5esw00QrUWkn6CPkJog7iYdL9pJNiX95Huc1FZ5OukntI0wSV8iHUf8lYi4v3Q9rULSx0g7GH8SETcWrcVNEGZmZXgL2MyskLZpA95///3j6quvLl2GmdmaUH8922YLePny5UOPZGbWRtomgM3MOo0D2MysEAewmVkhDmAzs0IcwGZmhTiAzcwKcQCbmRXiADYzK8QBbGZWiAPYzKwQB7CZWSG1B7Ckv5V0l6Q7JV0saQNJO0i6SdICSZdKWq/uOszMWk2tV0OTtDXp3kyviogn892FDybdIvqMiLhE0rdIV6Y/c6Tnf8EFt1Ue9/DDdx/p2ZuZDWo0miDGAxtKGk+6S+5i4K2kGxpCuj30gaNQh5lZS6k1gCNiEfBV4AFS8P6RdPfWFRHxXB7tIWDr/qaXdLSkHkk9vb29dZZqZjbqag1gSROAqaRbP28FbEy6nXklETEjIrojorurq6umKs3Myqi7CeJtwP0R0RsRz5Juxvh6YPPcJAEwGVhUcx1mZi2n7gB+AHidpI0kCZgCzAeuBw7K40zHd8U1szGo7jbgm0g72+YCd+T5zQCOB/5O0gLgxcA5ddZhZtaKar8pZ0ScBJzUp/d9wN51z9vMrJX5TDgzs0IcwGZmhdTeBFGSz24zs1bmLWAzs0IcwGZmhTiAzcwKcQCbmRXiADYzK8QBbGZWiAPYzKwQB7CZWSEOYDOzQhzAZmaFOIDNzApxAJuZFeIANjMrxAFsZlaIA9jMrBAHsJlZIQ5gM7NCHMBmZoU4gM3MCnEAm5kV4gA2MyvEAWxmVogD2MysEAewmVkhDmAzs0IcwGZmhdQawJJeKWle09+jko6TtIWk6yTdmx8n1FmHmVkrqjWAI+I3EbFHROwBvBp4AvgBcAIwJyJ2Aubk52ZmY8poNkFMAX4bEb8DpgIzc/+ZwIGjWIeZWUsYzQA+GLg4d0+MiMW5ewkwsb8JJB0tqUdST29v72jUaGY2akYlgCWtB7wX+F7fYRERQPQ3XUTMiIjuiOju6uqquUozs9E1WlvA7wTmRsTS/HyppEkA+XHZKNVhZtYyRiuAD2F18wPAbGB67p4OXDlKdZiZtYzaA1jSxsB+wPebep8K7CfpXuBt+bmZ2Zgyvu4ZRMTjwIv79HuYdFSEmdmY5TPhzMwKcQCbmRXiADYzK8QBbGZWiAPYzKwQB7CZWSEOYDOzQhzAZmaFOIDNzApxAJuZFeIANjMrxAFsZlaIA9jMrBAHsJlZIQ5gM7NCHMBmZoU4gM3MCnEAm5kV4gA2MyvEAWxmVogD2MysEAewmVkhDmAzs0IcwGZmhTiAzcwKcQCbmRXiADYzK8QBbGZWiAPYzKyQ2gNY0uaSLpN0j6S7Je0jaQtJ10m6Nz9OqLsOM7NWMxpbwP8OXB0ROwO7A3cDJwBzImInYE5+bmY2ptQawJI2A94EnAMQEc9ExApgKjAzjzYTOLDOOszMWlHdW8A7AL3AdyTdKunbkjYGJkbE4jzOEmBifxNLOlpSj6Se3t7emks1MxtddQfweGAv4MyI2BN4nD7NDRERQPQ3cUTMiIjuiOju6uqquVQzs9FVdwA/BDwUETfl55eRAnmppEkA+XFZzXWYmbWcWgM4IpYAD0p6Ze41BZgPzAam537TgSvrrMPMrBWNH4V5fAq4UNJ6wH3AkaTgnyXpKOB3wLRRqMPMrKXUHsARMQ/o7mfQlLrnbWbWynwmnJlZIQ5gM7NCHMBmZoU4gM3MCnEAm5kV4gA2MyvEAWxmVogD2MysEAewmVkhDmAzs0IcwGZmhVQKYEmvzxdSR9Jhkr4mabt6SzMz62xVt4DPBJ6QtDvw98BvgfNrq8rMbAyoGsDP5TtXTAW+ERH/BWxaX1lmZp2v6uUoV0o6ETgceKOkdYB16yvLzKzzVd0C/iDwNPCRfJeLycBXaqvKzGwMqBTAOXQvB9bPvZYDP6irKDOzsaDqURAfI91Q86zca2vgirqKMjMbC6o2QXwCeD3wKEBE3AtsWVdRZmZjQdUAfjoinmk8kTQeiHpKMjMbG6oG8A2SPgtsKGk/4HvAD+sry8ys81UN4BOAXuAO4OPAj4HP1VWUmdlYUOk44Ih4Hjg7/5mZ2QioFMCS7uDP23z/CPQAp0TEwyNdmJlZp6t6JtxPgFXARfn5wcBGwBLgPOA9I16ZmVmHqxrAb4uIvZqe3yFpbkTsJemwOgozM+t0VXfCjZO0d+OJpNcA4/LT50a8KjOzMaDqFvBHgXMlbQKIdELGR/M1gv+1ruLMzDpZ1aMgbgb+UtJm+fkfmwbPGmxaSQuBlaQ25OciolvSFsClwPbAQmBaRDwy3OLNzNpZ1S1gJB0A7AJsIAmAiPjnipO/JSKWNz0/AZgTEadKOiE/P75qLWZmnaDqxXi+Rbok5adITRAfANbmlkRTgZm5eyZw4Fq8lplZW6q6E+6vIuII4JGI+CKwD/CKitMGcK2kWyQdnftNjIjFuXsJMLFyxWZmHaJqE8ST+fEJSVsBDwOTKk77hohYJGlL4DpJ9zQPjIiQ1O+FfXJgHw2w7bbbVpydmVl7qLoFfJWkzUl3wZhL2nF2cZUJI2JRflxGuoj73sBSSZMA8uOyAaadERHdEdHd1dVVsVQzs/ZQ9Y4YX4qIFRFxOantd+eI+PxQ00naWNKmjW7g7cCdwGxgeh5tOnDlmhRvZtbOqu6E+0AjSIHPAN+RtGeFSScCv5R0G/Br4EcRcTVwKrCfpHuBt+XnZmZjStU24M9HxPckvYEUmF8BvgW8drCJIuI+YPd++j8MTBlmrWZmHaVqG/Cq/HgAMCMifgSsV09JZmZjQ9UAXiTpLNKxwD+WtP4wpjUzs35UDdFpwDXAOyJiBbAFqS3YzMzWUNU24EmkHWhPS9oX2A04v7aqzMzGgKpbwJcDqyS9HJgBbMPqi7ObmdkaqBrAz0fEc8D7gf+MiM9Q/Uw4MzPrR9UAflbSIcARwFW537r1lGRmNjZUDeAjSRfg+XJE3C9pB+CC+soyM+t8VS/IPl/S8cC2+fn9wGl1FmZm1umqnor8HmAecHV+voek2XUWZmbW6ao2QZxMuorZCoCImAe8rKaazMzGhMo74frcBw7g+ZEuxsxsLKl6IsZdkj5Euj39TsCngf+prywzs85XNYA/BfwT8DTpQuzXAF+qq6jRdsEFt1Ua7/DD/+zCbmZma6zqURBPkAL4n+otx8xs7Bg0gIc60iEi3juy5ZiZjR1DbQHvAzxIana4iXRLejMzGwFDBfBLgf2AQ4APAT8CLo6Iu+ouzMys0w16GFpErIqIqyNiOvA6YAHwc0mfHJXqzMw62JA74fLdLw4gbQVvD/wH6fbyZma2FobaCXc+sCvwY+CLEXHnqFRlZjYGDLUFfBjwOHAs8GnphX1wAiIiXlRjbWZmHW3QAI6IqhfrmRARj4xMSWZmY8NI3dl4zgi9jpnZmFH1VOShtPXxwT7F2MxKGKkt4Bih1zEzGzNGKoDNzGyYRiqA27oJwsyshMoBLOkNko7M3V35xpwNU0a8MjOzDlf1MLOTgOOBE3OvdYHvNoZHxB+GmH6cpFslXZWf7yDpJkkLJF0qab01K9/MrH1V3QJ+H/Be0kkZRMTvgU2HMZ9jgbubnp8GnBERLwceAY4axmuZmXWEqgH8TEQE+WgHSRtXnYGkyaRrSXw7PxfwVuCyPMpM4MCqr2dm1imqBvAsSWcBm0v6GPBT4OyK034d+EdW38TzxcCKiHguP38I2Lq/CSUdLalHUk9vb2/F2ZmZtYdKARwRXyVtsV4OvBL4QkT851DTSXo3sCwiblmT4iJiRkR0R0R3V1fXmryEmVnLqnwmXERcB1w3zNd/PfBeSe8CNgBeBPw7aUt6fN4KngwsGubrmpm1vapHQayU9Gifvwcl/UDSywaaLiJOjIjJEbE9cDDws4g4FLgeOCiPNh24ci2Xw8ys7VTdAv46qa32ItJJFwcDOwJzgXOBfYc53+OBSySdAtwKnDPM6c3M2p7SwQ1DjCTdFhG79+k3LyL26G9YHbq7u6Onp6fu2ZiZ1aHfs4WrHgXxhKRpktbJf9OAp/IwX4jHzGwNVA3gQ4HDgWXA0tx9mKQNAd+g08xsDVRqA46I+4D3DDD4lyNXjpnZ2FEpgCVtQDpdeBfS4WQARMRHaqrLzKzjVT0K4gLgHuAdwD+TmiTuHnSKDnPBBbdVHneoO2xUfa3bb1/KbrtNXOv5mVlrqtoG/PKI+DzweETMJF3b4bX1lWVm1vmqBvCz+XGFpF2BzYAt6ynJzGxsqNoEMUPSBOBzwGxgE+DztVVlZjYGDBnAktYBHo2IR4AbgQFPPTYzs+qGbIKIiOdJl5M0M7MRVLUN+KeS/kHSNpK2aPzVWpmZWYer2gb8wfz4iaZ+gZsjzMzWWNUz4XYYeiwzMxuOqtcD3kjS5yTNyM93yne7MDOzNVS1Dfg7wDPAX+Xni4BTaqnIzGyMqHo94J6I6JZ0a0TsmfuNynWAG3w9YDNrY2t1PeBn8qUnG7el3xF4eoQKMzMbk6oeBXEycDWwjaQLSTfb/HBNNZmZjQlVj4K4VtItwOtIm9LHRsTyWiszM+twVa8H/EPSDTlnR8Tj9ZZkZjY2VG0D/irwRmC+pMskHZQv0m5mZmuoahPEDcANksYBbwU+Rrod/YtqrM3MrKNV3QlHPgriPaTTkvcCzqupJjOzMaFqG/AsYG/SkRDfAFax+voQ1qTq7YZ8GyEzq9oGfA4wDVhJOivui4yxe8KZmY20QbeAJb0COCT/LQcuJZ0995ZRqM3MrKMN1QRxD/AL4N0RsQBA0t/WXpWZ2RgwVBPE+4HFwPWSzpY0hQHOaTYzs+EZNIAj4oqIOBjYGbgeOA7YUtKZkt4+GgWamXWqSjvhIuLxiLgoIt4DTAZuBY4fajpJG0j6taTbJN0l6Yu5/w6SbpK0QNKlktZbq6UwM2tDVY+CeEFEPBIRMyJiSoXRnwbemi9buQewv6TXAacBZ0TEy4FHgKOGW4eZWbsbdgAPRySP5afr5r8gnU13We4/EziwzjrMzFpRrQEMIGmcpHnAMuA64LfAioh4Lo/yELD1ANMeLalHUk9vb2/dpZqZjaraAzgiVkXEHqS2471JO/SqTjsjIrojorurq6u2Gs3MSqh8LYi1FRErJF0P7ANsLml83gqeTLrHXEfwKcZmVlWtW8CSuiRtnrs3BPYjncJ8PXBQHm06cGWddZiZtaK6t4AnATPzZSzXAWZFxFWS5gOXSDqFdEjbOTXXYWbWcmoN4Ii4Hdizn/73kdqDzczGrNp3wpmZWf8cwGZmhTiAzcwKcQCbmRXiADYzK2TUTsSwelS9Bx34JBGzVuMtYDOzQhzAZmaFOIDNzApxAJuZFeIANjMrxAFsZlaIA9jMrBAHsJlZIQ5gM7NCfCZcm/PZbWbty1vAZmaFOIDNzApxAJuZFeIANjMrxAFsZlaIA9jMrBAHsJlZIQ5gM7NCfCLGGFH11kU+scNs9HgL2MysEAewmVkhDmAzs0IcwGZmhdQawJK2kXS9pPmS7pJ0bO6/haTrJN2bHyfUWYeZWSuqewv4OeDvI+JVwOuAT0h6FXACMCcidgLm5OdmZmNKrQEcEYsjYm7uXgncDWwNTAVm5tFmAgfWWYeZWSsatTZgSdsDewI3ARMjYnEetASYOMA0R0vqkdTT29s7KnWamY2WUTkRQ9ImwOXAcRHxqKQXhkVESIr+pouIGcAMgO7u7n7HsZFz++1LK52wcfvtS9ltt36/M/+ET+owG1ztASxpXVL4XhgR38+9l0qaFBGLJU0CltVdx1hXJQyrni1nZiOj7qMgBJwD3B0RX2saNBuYnrunA1fWWYeZWSuqewv49cDhwB2S5uV+nwVOBWZJOgr4HTCt5jrMzFpOrQEcEb8ENMDgKXXO28ys1flMODOzQhzAZmaFOIDNzApxAJuZFeIANjMrxLckslqUOKtuJOfns/1sNDiA7QUjGSY+q85saG6CMDMrxAFsZlaIA9jMrBAHsJlZIQ5gM7NCHMBmZoU4gM3MCnEAm5kV4hMxrOWN9Fl1I6VqXeAz5qx/DmCrRYmz6nbbbeKoBp3P9rO15SYIM7NCHMBmZoU4gM3MCnEAm5kV4gA2MyvEAWxmVogD2MysEB8HbFazkTyRZCRvqTScE1d8Ikk9HMDW8lr1n79qXT5hwwbiJggzs0IcwGZmhdQawJLOlbRM0p1N/baQdJ2ke/PjhDprMDNrVXVvAZ8H7N+n3wnAnIjYCZiTn5uZjTm1BnBE3Aj8oU/vqcDM3D0TOLDOGszMWlWJNuCJEbE4dy8BRu8CrmZmLaToTriICCAGGi7paEk9knp6e3tHsTIzs/qVCOClkiYB5MdlA40YETMiojsiuru6ukatQDOz0VDiRIzZwHTg1Px4ZYEazKyiKmfylThDb7RfC0b+pKBaA1jSxcC+wEskPQScRAreWZKOAn4HTKuzBrPSWvVMvqp8Jl99ag3giDhkgEFT6pyvmVk78JlwZmaFOIDNzApxAJuZFeIANjMrxAFsZlaIA9jMrBAHsJlZIb4lkZkNqt1PJGll3gI2MyvEAWxmVogD2MysEAewmVkhDmAzs0IcwGZmhTiAzcwKcQCbmRXiADYzK8QBbGZWiAPYzKwQB7CZWSEOYDOzQhQRpWuoRFIv6Tb2w/USYPkIlzPavAytoxOWw8sw+pZHxP59e7ZNAK8pST0R0V26jrXhZWgdnbAcXobW4SYIM7NCHMBmZoWMhQCeUbqAEeBlaB2dsBxehhbR8W3AZmataixsAZuZtSQHsJlZIR0bwJL2l/QbSQsknVC6njUhaaGkOyTNk9RTup6qJJ0raZmkO5v6bSHpOkn35scJJWscygDLcLKkRXl9zJP0rpI1DkXSNpKulzRf0l2Sjs39221dDLQcbbU++tORbcCSxgH/B+wHPATcDBwSEfOLFjZMkhYC3RHRTgecI+lNwGPA+RGxa+73b8AfIuLU/IU4ISKOL1nnYAZYhpOBxyLiqyVrq0rSJGBSRMyVtClwC3Ag8GHaa10MtBzTaKP10Z9O3QLeG1gQEfdFxDPAJcDUwjWNGRFxI/CHPr2nAjNz90zSP1DLGmAZ2kpELI6Iubl7JXA3sDXtty4GWo6216kBvDXwYNPzh2jPFRbAtZJukXR06WLW0sSIWJy7lwATSxazFj4p6fbcRNHSP92bSdoe2BO4iTZeF32WA9p0fTR0agB3ijdExF7AO4FP5J/FbS9Su1c7tn2dCewI7AEsBk4vW041kjYBLgeOi4hHm4e107roZznacn0069QAXvnqPg8AAAPmSURBVARs0/R8cu7XViJiUX5cBvyA1LTSrpbmtrxGm96ywvUMW0QsjYhVEfE8cDZtsD4krUsKrQsj4vu5d9uti/6Wox3XR1+dGsA3AztJ2kHSesDBwOzCNQ2LpI3zDgckbQy8Hbhz8Kla2mxgeu6eDlxZsJY10git7H20+PqQJOAc4O6I+FrToLZaFwMtR7utj/505FEQAPmQlK8D44BzI+LLhUsaFkkvI231AowHLmqXZZB0MbAv6ZKBS4GTgCuAWcC2pMuKTouIlt3JNcAy7Ev6uRvAQuDjTW2pLUfSG4BfAHcAz+fenyW1n7bTuhhoOQ6hjdZHfzo2gM3MWl2nNkGYmbU8B7CZWSEOYDOzQhzAZmaFOIDNzApxAJuZFTK+dAFmAJJeDMzJT18KrAJ68/O980WVishXpVuZn44Dvg+cEhFPlarJOoOPA7aWU/dlHyWNi4hVwxh/IfmyoPl6BDOAZyNi+uBTmg3OTRDWsiS9WtIN+Wpw1zRdv+Dnkk6T9GtJ/yfpjbn/hyV9o2n6qyTtm7sfk3S6pNuAfSQdlqefJ+msfA3pIUXEY8AxwIH5wuabSJojaW6+eP7UPL9/lnRcUy1flnSspEmSbszzvbNRu41NDmBrVQL+EzgoIl4NnAs0n4o9PiL2Bo4jnSY8lI2BmyJid+Bh4IPA6yNiD1Jzx6FVC8tX4rof2Al4CnhfvmrdW4DT87ULzgWOAJC0Dul6JN8FPgRck+e7OzCv6nyt87gN2FrV+sCuwHUpzxhHuuRgQ+PKXrcA21d4vVWkq2kBTAFeDdycX3tDhn9FMDU9/ku+VOjzpOtOT4yIhZIelrQn6Xq7t0bEw5JuBs7NV/e6IiIcwGOYA9halYC7ImKfAYY/nR9Xsfpz/Bx/+qtug6bup5rafQXMjIgT16iwdJW67Um3vToU6AJeHRHP5vbixny/Tbr9z0tJW8RExI05rA8AzpP0tYg4f03qsPbnJghrVU8DXZL2gXQ9WEm7DDHNQmAPSetI2oaBrw87BzhI0pb5tbeQtF2VovJOuG+Stl4fATYDluXwfQvQ/Do/APYHXgNck6ffDlgaEWeTAnqvKvO1zuQtYGtVzwMHAf8haTPSZ/XrwF2DTPPfpLbZ+aT7hs3tb6SImC/pc6TbPa0DPAt8gnRpxoFcn9t21yEF65dy/wuBH0q6A+gB7mmazzOSrgdWNG197wt8RtKzpJt+HjHIPK3D+TA0s5rkcJ8LfCAi7i1dj7UeN0GY1UDSq4AFwByHrw3EW8BmmaSbSEdfNDs8Iu4oUY91PgewmVkhboIwMyvEAWxmVogD2MysEAewmVkh/x9C5vt7AYscZgAAAABJRU5ErkJggg==\n",
+            "text/plain": [
+              "<Figure size 360x360 with 1 Axes>"
+            ]
+          },
+          "metadata": {
+            "tags": [],
+            "needs_background": "light"
+          }
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "jLrBKO5PT3zm"
+      },
+      "source": [
+        "Most messages occur in the earliest tenure days, the average daily message volume for these users gradually tailed off.\n",
+        "\n",
+        "This aligns with what was seen in the distribution graph for bond score-counts, a much higher volume of bond scores were submitted in the earlier tenure days.\n"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "dhiLZVdHrsZu"
+      },
+      "source": [
+        "## Test 1.  Engagement and Bond score in the first 6 days"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "TNlouw_Trzfa"
+      },
+      "source": [
+        "The aim in this section is to examine whether there is a correlation between bond score in the first 6 days, and the volume of messages snet by the user."
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/",
+          "height": 235
+        },
+        "id": "UmV62muduL_F",
+        "outputId": "9717ad7f-c8b7-4443-eba3-56e84d50e2dd"
+      },
+      "source": [
+        "early_engagement = pd.DataFrame(pivot_activity, columns=[0,1,2,3,4,5,6])\n",
+        "early_engagement = early_engagement.fillna(0)\n",
+        "early_engagement[\"total_messages\"] = early_engagement.iloc[:, 0:7].sum(axis=1)\n",
+        "early_engagement.head(5)"
+      ],
+      "execution_count": null,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "text/html": [
+              "<div>\n",
+              "<style scoped>\n",
+              "    .dataframe tbody tr th:only-of-type {\n",
+              "        vertical-align: middle;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe tbody tr th {\n",
+              "        vertical-align: top;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe thead th {\n",
+              "        text-align: right;\n",
+              "    }\n",
+              "</style>\n",
+              "<table border=\"1\" class=\"dataframe\">\n",
+              "  <thead>\n",
+              "    <tr style=\"text-align: right;\">\n",
+              "      <th></th>\n",
+              "      <th>0</th>\n",
+              "      <th>1</th>\n",
+              "      <th>2</th>\n",
+              "      <th>3</th>\n",
+              "      <th>4</th>\n",
+              "      <th>5</th>\n",
+              "      <th>6</th>\n",
+              "      <th>total_messages</th>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>userid</th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "    </tr>\n",
+              "  </thead>\n",
+              "  <tbody>\n",
+              "    <tr>\n",
+              "      <th>+/wAfc2I0c831C21wvh2Kcr4DZk=</th>\n",
+              "      <td>33.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>30.0</td>\n",
+              "      <td>24.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>29.0</td>\n",
+              "      <td>116.0</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0NdvBGRsXuoa20PHou4K3FMlBA=</th>\n",
+              "      <td>54.0</td>\n",
+              "      <td>30.0</td>\n",
+              "      <td>22.0</td>\n",
+              "      <td>7.0</td>\n",
+              "      <td>7.0</td>\n",
+              "      <td>58.0</td>\n",
+              "      <td>5.0</td>\n",
+              "      <td>183.0</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0eFEPPuFJm9U5lXwlAKw/I+Clo=</th>\n",
+              "      <td>51.0</td>\n",
+              "      <td>150.0</td>\n",
+              "      <td>126.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>63.0</td>\n",
+              "      <td>390.0</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0pfU/ormz318pPBTZ6cWtrgHkI=</th>\n",
+              "      <td>103.0</td>\n",
+              "      <td>74.0</td>\n",
+              "      <td>11.0</td>\n",
+              "      <td>37.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>64.0</td>\n",
+              "      <td>67.0</td>\n",
+              "      <td>356.0</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+11s2fkg+oFKje/WvOYnzxbYgtY=</th>\n",
+              "      <td>65.0</td>\n",
+              "      <td>32.0</td>\n",
+              "      <td>11.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>48.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>2.0</td>\n",
+              "      <td>158.0</td>\n",
+              "    </tr>\n",
+              "  </tbody>\n",
+              "</table>\n",
+              "</div>"
+            ],
+            "text/plain": [
+              "                                  0      1      2  ...     5     6  total_messages\n",
+              "userid                                             ...                            \n",
+              "+/wAfc2I0c831C21wvh2Kcr4DZk=   33.0    0.0    0.0  ...   0.0  29.0           116.0\n",
+              "+0NdvBGRsXuoa20PHou4K3FMlBA=   54.0   30.0   22.0  ...  58.0   5.0           183.0\n",
+              "+0eFEPPuFJm9U5lXwlAKw/I+Clo=   51.0  150.0  126.0  ...   0.0  63.0           390.0\n",
+              "+0pfU/ormz318pPBTZ6cWtrgHkI=  103.0   74.0   11.0  ...  64.0  67.0           356.0\n",
+              "+11s2fkg+oFKje/WvOYnzxbYgtY=   65.0   32.0   11.0  ...   0.0   2.0           158.0\n",
+              "\n",
+              "[5 rows x 8 columns]"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 208
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "Q49eTtX4tQjZ"
+      },
+      "source": [
+        "Take the bond scores from the survey_repsonses data, these can be joined to the activity data using the 'userid' index"
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "qdOL5oKSwDqM"
+      },
+      "source": [
+        "earlyBondScores = newdf[[4,5,6]]"
+      ],
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "yXUQEZCsxU51"
+      },
+      "source": [
+        "earlyBondScores = earlyBondScores.fillna(0)"
+      ],
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "2G5MSt4ste-t"
+      },
+      "source": [
+        "Only one of these fields have data in them, so they can be added together to get the first bondscore for each userid"
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "v87HIskBymkV"
+      },
+      "source": [
+        "earlyBondScores[\"early_bond\"] = earlyBondScores[4] + earlyBondScores[5] + earlyBondScores[6]\n",
+        "del earlyBondScores[4], earlyBondScores[5], earlyBondScores[6]"
+      ],
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "mqgPyAioy4pv"
+      },
+      "source": [
+        "earlyEngagmentReduced = early_engagement[\"total_messages\"]\n",
+        "earlyEngagmentReduced = pd.DataFrame(earlyEngagmentReduced)"
+      ],
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "qS36eFRE2wHE"
+      },
+      "source": [
+        "The following merged dataframe will be used for correlation analysis."
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "dFIS_5zuvYVg"
+      },
+      "source": [
+        "# DF for correlation\n",
+        "bondAndEngagement = earlyBondScores.join(earlyEngagmentReduced)"
+      ],
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/",
+          "height": 235
+        },
+        "id": "hBsQfhp8xdDP",
+        "outputId": "7d45c2ee-456c-48ef-da54-b4216457f40f"
+      },
+      "source": [
+        "bondAndEngagement.head()"
+      ],
+      "execution_count": null,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "text/html": [
+              "<div>\n",
+              "<style scoped>\n",
+              "    .dataframe tbody tr th:only-of-type {\n",
+              "        vertical-align: middle;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe tbody tr th {\n",
+              "        vertical-align: top;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe thead th {\n",
+              "        text-align: right;\n",
+              "    }\n",
+              "</style>\n",
+              "<table border=\"1\" class=\"dataframe\">\n",
+              "  <thead>\n",
+              "    <tr style=\"text-align: right;\">\n",
+              "      <th></th>\n",
+              "      <th>early_bond</th>\n",
+              "      <th>total_messages</th>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>UserId</th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "    </tr>\n",
+              "  </thead>\n",
+              "  <tbody>\n",
+              "    <tr>\n",
+              "      <th>+/wAfc2I0c831C21wvh2Kcr4DZk=</th>\n",
+              "      <td>4.25</td>\n",
+              "      <td>116.0</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0NdvBGRsXuoa20PHou4K3FMlBA=</th>\n",
+              "      <td>3.75</td>\n",
+              "      <td>183.0</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0eFEPPuFJm9U5lXwlAKw/I+Clo=</th>\n",
+              "      <td>3.75</td>\n",
+              "      <td>390.0</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0pfU/ormz318pPBTZ6cWtrgHkI=</th>\n",
+              "      <td>5.00</td>\n",
+              "      <td>356.0</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+11s2fkg+oFKje/WvOYnzxbYgtY=</th>\n",
+              "      <td>4.50</td>\n",
+              "      <td>158.0</td>\n",
+              "    </tr>\n",
+              "  </tbody>\n",
+              "</table>\n",
+              "</div>"
+            ],
+            "text/plain": [
+              "                              early_bond  total_messages\n",
+              "UserId                                                  \n",
+              "+/wAfc2I0c831C21wvh2Kcr4DZk=        4.25           116.0\n",
+              "+0NdvBGRsXuoa20PHou4K3FMlBA=        3.75           183.0\n",
+              "+0eFEPPuFJm9U5lXwlAKw/I+Clo=        3.75           390.0\n",
+              "+0pfU/ormz318pPBTZ6cWtrgHkI=        5.00           356.0\n",
+              "+11s2fkg+oFKje/WvOYnzxbYgtY=        4.50           158.0"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 214
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "Gsb7TPOI22O4"
+      },
+      "source": [
+        "## Result 1. Pearsons r correlation analysis - Early bond score and user messages"
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/"
+        },
+        "id": "LZi81e3ozYbu",
+        "outputId": "267b9b49-2d32-4934-e778-4c38b8ee3356"
+      },
+      "source": [
+        "corr, _ = pearsonr(merged['early_bond'], merged['total_messages'])\n",
+        "print('Pearsons correlation: %.3f' % corr)"
+      ],
+      "execution_count": null,
+      "outputs": [
+        {
+          "output_type": "stream",
+          "text": [
+            "Pearsons correlation: -0.022\n"
+          ],
+          "name": "stdout"
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "fdBi8bW0laKp"
+      },
+      "source": [
+        "The Pearsons r score of -0.022 shows that there is no correlation between early bond score and total messages sent per user in the first 6 days.\n",
+        "\n",
+        "This indicates, based on those samples selected, that levels of engagement do not impact the therapeutic bond that the user has with the bot."
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "SPL5dC7UTDS4"
+      },
+      "source": [
+        "## Test 2. Participants who recorded two bond scores\n"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "UcFcIDzv3cK9"
+      },
+      "source": [
+        "Next, selecting the subset of 934 users who submitted two bond scores, we can examine whether there is any correlation between their engagement, as gauged by:\n",
+        "\n",
+        "\n",
+        "1.   Total volume of messages sent over the 28 day period\n",
+        "\n",
+        "\n",
+        "This figure are tested against the change metric in the bond\n",
+        "score."
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "8_iv20jTTNWG"
+      },
+      "source": [
+        "changeMetric = TwoScores[\"Change\"]"
+      ],
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "ZTPOuoM4U8oJ"
+      },
+      "source": [
+        "pivot_activity = pivot_activity.fillna(0)"
+      ],
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "KSrnogiLTZ3s"
+      },
+      "source": [
+        "activityAndChange = pivot_activity.join(changeMetric)"
+      ],
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "PUCTDznJt5T2"
+      },
+      "source": [
+        "Create a reduced dataframe to measure any correlation between the change in bond score and the total messages sent"
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "Q-uRjgIqJGpL"
+      },
+      "source": [
+        "activityAndChange = activityAndChange[activityAndChange['Change'].notna()]"
+      ],
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/",
+          "height": 235
+        },
+        "id": "4srZFP7QUcF1",
+        "outputId": "6e3cb330-a00e-4807-98ff-e3257432a193"
+      },
+      "source": [
+        "activityAndChange.head(5)\n"
+      ],
+      "execution_count": null,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "text/html": [
+              "<div>\n",
+              "<style scoped>\n",
+              "    .dataframe tbody tr th:only-of-type {\n",
+              "        vertical-align: middle;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe tbody tr th {\n",
+              "        vertical-align: top;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe thead th {\n",
+              "        text-align: right;\n",
+              "    }\n",
+              "</style>\n",
+              "<table border=\"1\" class=\"dataframe\">\n",
+              "  <thead>\n",
+              "    <tr style=\"text-align: right;\">\n",
+              "      <th></th>\n",
+              "      <th>0</th>\n",
+              "      <th>1</th>\n",
+              "      <th>2</th>\n",
+              "      <th>3</th>\n",
+              "      <th>4</th>\n",
+              "      <th>5</th>\n",
+              "      <th>6</th>\n",
+              "      <th>7</th>\n",
+              "      <th>8</th>\n",
+              "      <th>9</th>\n",
+              "      <th>10</th>\n",
+              "      <th>11</th>\n",
+              "      <th>12</th>\n",
+              "      <th>13</th>\n",
+              "      <th>14</th>\n",
+              "      <th>15</th>\n",
+              "      <th>16</th>\n",
+              "      <th>17</th>\n",
+              "      <th>18</th>\n",
+              "      <th>19</th>\n",
+              "      <th>20</th>\n",
+              "      <th>21</th>\n",
+              "      <th>22</th>\n",
+              "      <th>23</th>\n",
+              "      <th>24</th>\n",
+              "      <th>25</th>\n",
+              "      <th>26</th>\n",
+              "      <th>27</th>\n",
+              "      <th>28</th>\n",
+              "      <th>Change</th>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>userid</th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "    </tr>\n",
+              "  </thead>\n",
+              "  <tbody>\n",
+              "    <tr>\n",
+              "      <th>+/wAfc2I0c831C21wvh2Kcr4DZk=</th>\n",
+              "      <td>33.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>30.0</td>\n",
+              "      <td>24.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>29.0</td>\n",
+              "      <td>37.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>19.0</td>\n",
+              "      <td>22.0</td>\n",
+              "      <td>46.0</td>\n",
+              "      <td>23.0</td>\n",
+              "      <td>106.0</td>\n",
+              "      <td>23.0</td>\n",
+              "      <td>19.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>15.0</td>\n",
+              "      <td>19.0</td>\n",
+              "      <td>54.0</td>\n",
+              "      <td>33.0</td>\n",
+              "      <td>14.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>33.0</td>\n",
+              "      <td>-0.25</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0pfU/ormz318pPBTZ6cWtrgHkI=</th>\n",
+              "      <td>103.0</td>\n",
+              "      <td>74.0</td>\n",
+              "      <td>11.0</td>\n",
+              "      <td>37.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>64.0</td>\n",
+              "      <td>67.0</td>\n",
+              "      <td>19.0</td>\n",
+              "      <td>51.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>50.0</td>\n",
+              "      <td>22.0</td>\n",
+              "      <td>57.0</td>\n",
+              "      <td>47.0</td>\n",
+              "      <td>9.0</td>\n",
+              "      <td>43.0</td>\n",
+              "      <td>15.0</td>\n",
+              "      <td>18.0</td>\n",
+              "      <td>23.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>40.0</td>\n",
+              "      <td>2.0</td>\n",
+              "      <td>26.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>9.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>56.0</td>\n",
+              "      <td>-0.00</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+4XFQAS/fIojw07hLfZk6PZiGzA=</th>\n",
+              "      <td>145.0</td>\n",
+              "      <td>103.0</td>\n",
+              "      <td>119.0</td>\n",
+              "      <td>34.0</td>\n",
+              "      <td>79.0</td>\n",
+              "      <td>31.0</td>\n",
+              "      <td>44.0</td>\n",
+              "      <td>22.0</td>\n",
+              "      <td>39.0</td>\n",
+              "      <td>63.0</td>\n",
+              "      <td>130.0</td>\n",
+              "      <td>47.0</td>\n",
+              "      <td>19.0</td>\n",
+              "      <td>43.0</td>\n",
+              "      <td>37.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>12.0</td>\n",
+              "      <td>1.0</td>\n",
+              "      <td>64.0</td>\n",
+              "      <td>27.0</td>\n",
+              "      <td>57.0</td>\n",
+              "      <td>68.0</td>\n",
+              "      <td>84.0</td>\n",
+              "      <td>192.0</td>\n",
+              "      <td>5.0</td>\n",
+              "      <td>71.0</td>\n",
+              "      <td>45.0</td>\n",
+              "      <td>21.0</td>\n",
+              "      <td>45.0</td>\n",
+              "      <td>-0.00</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+6hscmdASu/PfR0HuiO9AzKlNdQ=</th>\n",
+              "      <td>52.0</td>\n",
+              "      <td>81.0</td>\n",
+              "      <td>63.0</td>\n",
+              "      <td>456.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>129.0</td>\n",
+              "      <td>63.0</td>\n",
+              "      <td>361.0</td>\n",
+              "      <td>136.0</td>\n",
+              "      <td>45.0</td>\n",
+              "      <td>20.0</td>\n",
+              "      <td>70.0</td>\n",
+              "      <td>21.0</td>\n",
+              "      <td>54.0</td>\n",
+              "      <td>4.0</td>\n",
+              "      <td>26.0</td>\n",
+              "      <td>24.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>8.0</td>\n",
+              "      <td>11.0</td>\n",
+              "      <td>28.0</td>\n",
+              "      <td>3.0</td>\n",
+              "      <td>52.0</td>\n",
+              "      <td>8.0</td>\n",
+              "      <td>30.0</td>\n",
+              "      <td>-0.00</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+9kMKboj6nxl0kWR3t90grCXt5k=</th>\n",
+              "      <td>56.0</td>\n",
+              "      <td>24.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>10.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>65.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>18.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>8.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>23.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>28.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>24.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>-0.75</td>\n",
+              "    </tr>\n",
+              "  </tbody>\n",
+              "</table>\n",
+              "</div>"
+            ],
+            "text/plain": [
+              "                                  0      1      2  ...    27    28  Change\n",
+              "userid                                             ...                    \n",
+              "+/wAfc2I0c831C21wvh2Kcr4DZk=   33.0    0.0    0.0  ...  25.0  33.0   -0.25\n",
+              "+0pfU/ormz318pPBTZ6cWtrgHkI=  103.0   74.0   11.0  ...   0.0  56.0   -0.00\n",
+              "+4XFQAS/fIojw07hLfZk6PZiGzA=  145.0  103.0  119.0  ...  21.0  45.0   -0.00\n",
+              "+6hscmdASu/PfR0HuiO9AzKlNdQ=   52.0   81.0   63.0  ...   8.0  30.0   -0.00\n",
+              "+9kMKboj6nxl0kWR3t90grCXt5k=   56.0   24.0    0.0  ...   0.0   0.0   -0.75\n",
+              "\n",
+              "[5 rows x 30 columns]"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 222
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "eQNCE6or5Lqf"
+      },
+      "source": [
+        "Add Total messages and Average Messages fields"
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "Etpir_BaYEzO"
+      },
+      "source": [
+        "activityAndChange['Total_Messages_per_user']= activityAndChange.iloc[:, 1:-2].sum(axis=1)\n"
+      ],
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "HF8h5IoaZh7A"
+      },
+      "source": [
+        "activityAndChange['Average_Messages_per_user'] = activityAndChange.iloc[:, 1:-3].mean(axis=1)"
+      ],
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/",
+          "height": 255
+        },
+        "id": "FikU2DEOYwuN",
+        "outputId": "410b61b9-d580-42a7-93d8-0d1ed01e2e1a"
+      },
+      "source": [
+        "activityAndChange.head(5)"
+      ],
+      "execution_count": null,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "text/html": [
+              "<div>\n",
+              "<style scoped>\n",
+              "    .dataframe tbody tr th:only-of-type {\n",
+              "        vertical-align: middle;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe tbody tr th {\n",
+              "        vertical-align: top;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe thead th {\n",
+              "        text-align: right;\n",
+              "    }\n",
+              "</style>\n",
+              "<table border=\"1\" class=\"dataframe\">\n",
+              "  <thead>\n",
+              "    <tr style=\"text-align: right;\">\n",
+              "      <th></th>\n",
+              "      <th>0</th>\n",
+              "      <th>1</th>\n",
+              "      <th>2</th>\n",
+              "      <th>3</th>\n",
+              "      <th>4</th>\n",
+              "      <th>5</th>\n",
+              "      <th>6</th>\n",
+              "      <th>7</th>\n",
+              "      <th>8</th>\n",
+              "      <th>9</th>\n",
+              "      <th>10</th>\n",
+              "      <th>11</th>\n",
+              "      <th>12</th>\n",
+              "      <th>13</th>\n",
+              "      <th>14</th>\n",
+              "      <th>15</th>\n",
+              "      <th>16</th>\n",
+              "      <th>17</th>\n",
+              "      <th>18</th>\n",
+              "      <th>19</th>\n",
+              "      <th>20</th>\n",
+              "      <th>21</th>\n",
+              "      <th>22</th>\n",
+              "      <th>23</th>\n",
+              "      <th>24</th>\n",
+              "      <th>25</th>\n",
+              "      <th>26</th>\n",
+              "      <th>27</th>\n",
+              "      <th>28</th>\n",
+              "      <th>Change</th>\n",
+              "      <th>Total_Messages_per_user</th>\n",
+              "      <th>Average_Messages_per_user</th>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>userid</th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "    </tr>\n",
+              "  </thead>\n",
+              "  <tbody>\n",
+              "    <tr>\n",
+              "      <th>+/wAfc2I0c831C21wvh2Kcr4DZk=</th>\n",
+              "      <td>33.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>30.0</td>\n",
+              "      <td>24.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>29.0</td>\n",
+              "      <td>37.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>19.0</td>\n",
+              "      <td>22.0</td>\n",
+              "      <td>46.0</td>\n",
+              "      <td>23.0</td>\n",
+              "      <td>106.0</td>\n",
+              "      <td>23.0</td>\n",
+              "      <td>19.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>15.0</td>\n",
+              "      <td>19.0</td>\n",
+              "      <td>54.0</td>\n",
+              "      <td>33.0</td>\n",
+              "      <td>14.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>33.0</td>\n",
+              "      <td>-0.25</td>\n",
+              "      <td>613.0</td>\n",
+              "      <td>22.703704</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0pfU/ormz318pPBTZ6cWtrgHkI=</th>\n",
+              "      <td>103.0</td>\n",
+              "      <td>74.0</td>\n",
+              "      <td>11.0</td>\n",
+              "      <td>37.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>64.0</td>\n",
+              "      <td>67.0</td>\n",
+              "      <td>19.0</td>\n",
+              "      <td>51.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>50.0</td>\n",
+              "      <td>22.0</td>\n",
+              "      <td>57.0</td>\n",
+              "      <td>47.0</td>\n",
+              "      <td>9.0</td>\n",
+              "      <td>43.0</td>\n",
+              "      <td>15.0</td>\n",
+              "      <td>18.0</td>\n",
+              "      <td>23.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>40.0</td>\n",
+              "      <td>2.0</td>\n",
+              "      <td>26.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>9.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>56.0</td>\n",
+              "      <td>-0.00</td>\n",
+              "      <td>734.0</td>\n",
+              "      <td>27.185185</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+4XFQAS/fIojw07hLfZk6PZiGzA=</th>\n",
+              "      <td>145.0</td>\n",
+              "      <td>103.0</td>\n",
+              "      <td>119.0</td>\n",
+              "      <td>34.0</td>\n",
+              "      <td>79.0</td>\n",
+              "      <td>31.0</td>\n",
+              "      <td>44.0</td>\n",
+              "      <td>22.0</td>\n",
+              "      <td>39.0</td>\n",
+              "      <td>63.0</td>\n",
+              "      <td>130.0</td>\n",
+              "      <td>47.0</td>\n",
+              "      <td>19.0</td>\n",
+              "      <td>43.0</td>\n",
+              "      <td>37.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>12.0</td>\n",
+              "      <td>1.0</td>\n",
+              "      <td>64.0</td>\n",
+              "      <td>27.0</td>\n",
+              "      <td>57.0</td>\n",
+              "      <td>68.0</td>\n",
+              "      <td>84.0</td>\n",
+              "      <td>192.0</td>\n",
+              "      <td>5.0</td>\n",
+              "      <td>71.0</td>\n",
+              "      <td>45.0</td>\n",
+              "      <td>21.0</td>\n",
+              "      <td>45.0</td>\n",
+              "      <td>-0.00</td>\n",
+              "      <td>1482.0</td>\n",
+              "      <td>54.888889</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+6hscmdASu/PfR0HuiO9AzKlNdQ=</th>\n",
+              "      <td>52.0</td>\n",
+              "      <td>81.0</td>\n",
+              "      <td>63.0</td>\n",
+              "      <td>456.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>129.0</td>\n",
+              "      <td>63.0</td>\n",
+              "      <td>361.0</td>\n",
+              "      <td>136.0</td>\n",
+              "      <td>45.0</td>\n",
+              "      <td>20.0</td>\n",
+              "      <td>70.0</td>\n",
+              "      <td>21.0</td>\n",
+              "      <td>54.0</td>\n",
+              "      <td>4.0</td>\n",
+              "      <td>26.0</td>\n",
+              "      <td>24.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>8.0</td>\n",
+              "      <td>11.0</td>\n",
+              "      <td>28.0</td>\n",
+              "      <td>3.0</td>\n",
+              "      <td>52.0</td>\n",
+              "      <td>8.0</td>\n",
+              "      <td>30.0</td>\n",
+              "      <td>-0.00</td>\n",
+              "      <td>1663.0</td>\n",
+              "      <td>61.592593</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+9kMKboj6nxl0kWR3t90grCXt5k=</th>\n",
+              "      <td>56.0</td>\n",
+              "      <td>24.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>10.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>65.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>18.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>8.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>23.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>28.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>24.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>-0.75</td>\n",
+              "      <td>200.0</td>\n",
+              "      <td>7.407407</td>\n",
+              "    </tr>\n",
+              "  </tbody>\n",
+              "</table>\n",
+              "</div>"
+            ],
+            "text/plain": [
+              "                                  0  ...  Average_Messages_per_user\n",
+              "userid                               ...                           \n",
+              "+/wAfc2I0c831C21wvh2Kcr4DZk=   33.0  ...                  22.703704\n",
+              "+0pfU/ormz318pPBTZ6cWtrgHkI=  103.0  ...                  27.185185\n",
+              "+4XFQAS/fIojw07hLfZk6PZiGzA=  145.0  ...                  54.888889\n",
+              "+6hscmdASu/PfR0HuiO9AzKlNdQ=   52.0  ...                  61.592593\n",
+              "+9kMKboj6nxl0kWR3t90grCXt5k=   56.0  ...                   7.407407\n",
+              "\n",
+              "[5 rows x 32 columns]"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 227
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "7l-DuJq65uAm"
+      },
+      "source": [
+        "## Result 2. Pearsons r correlation - Change in bond score and user messages"
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/"
+        },
+        "id": "3OvA46OnZAXW",
+        "outputId": "7cc6e837-a8f1-485d-b258-cf3ecc93de53"
+      },
+      "source": [
+        "corr2, _ = pearsonr(activityAndChange['Change'], activityAndChange['Total_Messages_per_user'])\n",
+        "print('Pearsons correlation: %.3f' % corr2)"
+      ],
+      "execution_count": null,
+      "outputs": [
+        {
+          "output_type": "stream",
+          "text": [
+            "Pearsons correlation: 0.022\n"
+          ],
+          "name": "stdout"
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "QOFpN_aI5qxA"
+      },
+      "source": [
+        "The Pearsons correaltion of 0.022 indicates no correlation between change in bond score, and user engagement."
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "E0mvUH-J6kk0"
+      },
+      "source": [
+        "## Test 3. Statistical testing of the mean of two groups: low bond score and high bond score"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "FvpFHmi-7B0A"
+      },
+      "source": [
+        "In this final test: \n",
+        "\n",
+        "1.   The data is ordered by early bond score, from lowest to highest\n",
+        "2.   The messages column is split in two; half of the message totals relating to low bond scores are in one list, and the other half relating to high bond scores are in the other.\n",
+        "3.   The two lists are tested for normality using a Shapiro-Wilkes test, the lists are identified to be non-parametric\n",
+        "4. A Mann Whitney U test is implemented to compare the two groups, and understand whether there is a significant difference in the total message volumes (and the engagement) of the users with low bond scores, and those with high bond scores\n",
+        "3.   The Null hypothesis, or baseline assumption,  is that there is no significant difference in the mean number of messages sent per user between the low bond-score and high bond-score groups.\n",
+        "\n",
+        "\n"
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "YzjZ7qXdjz9F"
+      },
+      "source": [
+        "sortedByBond = bondAndEngagement"
+      ],
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "w4eb_E0Pl73H"
+      },
+      "source": [
+        "sortedByBond.sort_values(by=['early_bond'], inplace=True)"
+      ],
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "B3c-4FIsnIkc"
+      },
+      "source": [
+        "Now that the datdframe is ordered by bond score, Let's split the totoal messages data into two lists, the total message numbers for the lower scores, and the total messages for the higher scores.\n",
+        "\n"
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "G03XikqMna1f"
+      },
+      "source": [
+        "len(sortedMerged)\n",
+        "lower = sortedMerged[\"total_messages\"].iloc[:2188]\n",
+        "higher = sortedMerged[\"total_messages\"].iloc[2188:]\n",
+        "#df.iloc[:n,:]"
+      ],
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "RHqlhOfYoTYR"
+      },
+      "source": [
+        "lower = list(lower)\n",
+        "higher = list(higher)"
+      ],
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "kxRXlYsxoywh"
+      },
+      "source": [
+        "Shapiro-Wilkes tests below tell us that the distributions of the lists are non-Gaussian, meaning we will use non-parametric testing.\n",
+        "\n",
+        "Alpha is set to 0.5\n",
+        "\n",
+        "Instead of using a studnents t-test, we can use a Mann-Whitney U test.\n",
+        "\n",
+        "The Null hypothesis is that there is no difference in the mean number of messages sent between the low-score and high-score groups."
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/"
+        },
+        "id": "kNdl8R9Vodt2",
+        "outputId": "6c51cd82-7472-4315-9d43-9aef5a02d677"
+      },
+      "source": [
+        "from scipy.stats import shapiro\n",
+        "stat, p = shapiro(lower)\n",
+        "print('Statistics=%.3f, p=%.3f' % (stat, p))\n",
+        "# interpret\n",
+        "alpha = 0.05\n",
+        "if p > alpha:\n",
+        "\tprint('Sample looks Gaussian (fail to reject H0)')\n",
+        "else:\n",
+        "\tprint('Sample does not look Gaussian (reject H0)')"
+      ],
+      "execution_count": null,
+      "outputs": [
+        {
+          "output_type": "stream",
+          "text": [
+            "Statistics=0.792, p=0.000\n",
+            "Sample does not look Gaussian (reject H0)\n"
+          ],
+          "name": "stdout"
+        }
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/"
+        },
+        "id": "Q6gG3LCuouKl",
+        "outputId": "b9e9fcd7-0f53-4904-b689-a4df1d3f1f14"
+      },
+      "source": [
+        "stat, p = shapiro(higher)\n",
+        "print('Statistics=%.3f, p=%.3f' % (stat, p))\n",
+        "# interpret\n",
+        "alpha = 0.05\n",
+        "if p > alpha:\n",
+        "\tprint('Sample looks Gaussian (fail to reject H0)')\n",
+        "else:\n",
+        "\tprint('Sample does not look Gaussian (reject H0)')"
+      ],
+      "execution_count": null,
+      "outputs": [
+        {
+          "output_type": "stream",
+          "text": [
+            "Statistics=0.809, p=0.000\n",
+            "Sample does not look Gaussian (reject H0)\n"
+          ],
+          "name": "stdout"
+        }
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/"
+        },
+        "id": "nIfuvpRlpCYU",
+        "outputId": "cff78bac-6e0b-47de-e65f-98fd00bf4502"
+      },
+      "source": [
+        "print(np.mean(lower))\n",
+        "print(np.mean(higher))"
+      ],
+      "execution_count": null,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "text/plain": [
+              "286.3841936957515"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 175
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "mNgnD4sIpHyn"
+      },
+      "source": [
+        "To test if there is a significant difference between volumes of messages (engagement) sent by participants who submitted low scores and those who submitted high scores, we can pwrform a Mann-Whitney U-test on the two lists."
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "fV9qJ9Z0p1Iq"
+      },
+      "source": [
+        "import scipy.stats as stats\n",
+        "t, pvalue = stats.mannwhitneyu(lower,higher, alternative=None)"
+      ],
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/"
+        },
+        "id": "yNQPby3yp5JV",
+        "outputId": "961ceee1-5c6b-4251-ddf1-6d260d23502f"
+      },
+      "source": [
+        "print(t)\n",
+        "print(pvalue)"
+      ],
+      "execution_count": null,
+      "outputs": [
+        {
+          "output_type": "stream",
+          "text": [
+            "2352817.0\n",
+            "0.15780557009578583\n"
+          ],
+          "name": "stdout"
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "mWUVTIGxq8zG"
+      },
+      "source": [
+        "## Results 3. Comparison of two groups, low bond score and high bond score - do their engaement levels differ?\n"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "D07kejG4847B"
+      },
+      "source": [
+        "The p-value is significantly above alpha of 0.05, we do not reject the above Null hypothesis: \n",
+        "\n",
+        "There is no significant difference in engagement levels of users of the bot depending on bond score."
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "RCEW4Bob9tDS"
+      },
+      "source": [
+        "# Task 3 - Additional Analysis\n"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "igd-l5O595e6"
+      },
+      "source": [
+        "1. If further data were available (assuming data protection regulation allowed for the collection of the data) on the user profiles like Geography, Occupation, Age, Gender etc, we could potentially derive further insights from the data at a more granular level. We could see whether certain profile groups had a tendency to allocate higher or lower bond scores, or were more engaged than others. "
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "aj9qA7p6_D8E"
+      },
+      "source": [
+        "2. Further information on the quantity of the data in each message would be interesting to see. It is unclear from the data how long each message interaction is in terms of characters, or the type of language that was used. It would also be of interest to know why there wasn't a second bond score recorded for the majority of users."
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "1AaBGE7C_XjG"
+      },
+      "source": [
+        "3. Analysing the chat logs to look at the langauge used would be very interesting for sentiment analysis. This could assist in gauging the 'mood' of the user, in conjunction with the 'moodCategory' variable. We could potentially analyse the terms used in the log, and see if the use of certain terms correlates with engagement of bond."
+      ]
+    }
+  ]
+}
\ No newline at end of file
diff --git a/Copy_of_colab_github_demo.ipynb b/Copy_of_colab_github_demo.ipynb
new file mode 100644
index 00000000..34359db8
--- /dev/null
+++ b/Copy_of_colab_github_demo.ipynb
@@ -0,0 +1,161 @@
+{
+  "nbformat": 4,
+  "nbformat_minor": 0,
+  "metadata": {
+    "colab": {
+      "name": "Copy of colab-github-demo.ipynb",
+      "provenance": [],
+      "collapsed_sections": [],
+      "include_colab_link": true
+    },
+    "kernelspec": {
+      "display_name": "Python 3",
+      "name": "python3"
+    }
+  },
+  "cells": [
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "view-in-github",
+        "colab_type": "text"
+      },
+      "source": [
+        "<a href=\"https://colab.research.google.com/github/Dom1984/python/blob/master/Copy_of_colab_github_demo.ipynb\" target=\"_parent\"><img src=\"https://colab.research.google.com/assets/colab-badge.svg\" alt=\"Open In Colab\"/></a>"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "colab_type": "text",
+        "id": "-pVhOfzLx9us"
+      },
+      "source": [
+        "# Using Google Colab with GitHub\n",
+        "\n"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "colab_type": "text",
+        "id": "wKJ4bd5rt1wy"
+      },
+      "source": [
+        "\n",
+        "[Google Colaboratory](http://colab.research.google.com) is designed to integrate cleanly with GitHub, allowing both loading notebooks from github and saving notebooks to github."
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "colab_type": "text",
+        "id": "K-NVg7RjyeTk"
+      },
+      "source": [
+        "## Loading Public Notebooks Directly from GitHub\n",
+        "\n",
+        "Colab can load public github notebooks directly, with no required authorization step.\n",
+        "\n",
+        "For example, consider the notebook at this address: https://github.com/googlecolab/colabtools/blob/master/notebooks/colab-github-demo.ipynb.\n",
+        "\n",
+        "The direct colab link to this notebook is: https://colab.research.google.com/github/googlecolab/colabtools/blob/master/notebooks/colab-github-demo.ipynb.\n",
+        "\n",
+        "To generate such links in one click, you can use the [Open in Colab](https://chrome.google.com/webstore/detail/open-in-colab/iogfkhleblhcpcekbiedikdehleodpjo) Chrome extension."
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "colab_type": "text",
+        "id": "WzIRIt9d2huC"
+      },
+      "source": [
+        "## Browsing GitHub Repositories from Colab\n",
+        "\n",
+        "Colab also supports special URLs that link directly to a GitHub browser for any user/organization, repository, or branch. For example:\n",
+        "\n",
+        "- http://colab.research.google.com/github will give you a general github browser, where you can search for any github organization or username.\n",
+        "- http://colab.research.google.com/github/googlecolab/ will open the repository browser for the ``googlecolab`` organization. Replace ``googlecolab`` with any other github org or user to see their repositories.\n",
+        "- http://colab.research.google.com/github/googlecolab/colabtools/ will let you browse the main branch of the ``colabtools`` repository within the ``googlecolab`` organization. Substitute any user/org and repository to see its contents.\n",
+        "- http://colab.research.google.com/github/googlecolab/colabtools/blob/master will let you browse ``master`` branch of the ``colabtools`` repository within the ``googlecolab`` organization. (don't forget the ``blob`` here!) You can specify any valid branch for any valid repository."
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "colab_type": "text",
+        "id": "Rmai0dD30XzL"
+      },
+      "source": [
+        "## Loading Private Notebooks\n",
+        "\n",
+        "Loading a notebook from a private GitHub repository is possible, but requires an additional step to allow Colab to access your files.\n",
+        "Do the following:\n",
+        "\n",
+        "1. Navigate to http://colab.research.google.com/github.\n",
+        "2. Click the \"Include Private Repos\" checkbox.\n",
+        "3. In the popup window, sign-in to your Github account and authorize Colab to read the private files.\n",
+        "4. Your private repositories and notebooks will now be available via the github navigation pane."
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "colab_type": "text",
+        "id": "8J3NBxtZpPcK"
+      },
+      "source": [
+        "## Saving Notebooks To GitHub or Drive\n",
+        "\n",
+        "Any time you open a GitHub hosted notebook in Colab, it opens a new editable view of the notebook. You can run and modify the notebook without worrying about overwriting the source.\n",
+        "\n",
+        "If you would like to save your changes from within Colab, you can use the File menu to save the modified notebook either to Google Drive or back to GitHub. Choose **File→Save a copy in Drive** or **File→Save a copy to GitHub** and follow the resulting prompts. To save a Colab notebook to GitHub requires giving Colab permission to push the commit to your repository."
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "colab_type": "text",
+        "id": "8QAWNjizy_3O"
+      },
+      "source": [
+        "## Open In Colab Badge\n",
+        "\n",
+        "Anybody can open a copy of any github-hosted notebook within Colab. To make it easier to give people access to live views of GitHub-hosted notebooks,\n",
+        "colab provides a [shields.io](http://shields.io/)-style badge, which appears as follows:\n",
+        "\n",
+        "[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/googlecolab/colabtools/blob/master/notebooks/colab-github-demo.ipynb)\n",
+        "\n",
+        "The markdown for the above badge is the following:\n",
+        "\n",
+        "```markdown\n",
+        "[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/googlecolab/colabtools/blob/master/notebooks/colab-github-demo.ipynb)\n",
+        "```\n",
+        "\n",
+        "The HTML equivalent is:\n",
+        "\n",
+        "```HTML\n",
+        "<a href=\"https://colab.research.google.com/github/googlecolab/colabtools/blob/master/notebooks/colab-github-demo.ipynb\">\n",
+        "  <img src=\"https://colab.research.google.com/assets/colab-badge.svg\" alt=\"Open In Colab\"/>\n",
+        "</a>\n",
+        "```\n",
+        "\n",
+        "Remember to replace the notebook URL in this template with the notebook you want to link to."
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab_type": "code",
+        "id": "3VQqVi-3ScBC",
+        "colab": {}
+      },
+      "source": [
+        ""
+      ],
+      "execution_count": 0,
+      "outputs": []
+    }
+  ]
+}
\ No newline at end of file
diff --git a/WoeBot.ipynb b/WoeBot.ipynb
new file mode 100644
index 00000000..2f011b9f
--- /dev/null
+++ b/WoeBot.ipynb
@@ -0,0 +1,2756 @@
+{
+  "nbformat": 4,
+  "nbformat_minor": 0,
+  "metadata": {
+    "colab": {
+      "name": "WoeBot.ipynb",
+      "provenance": [],
+      "collapsed_sections": [],
+      "toc_visible": true,
+      "authorship_tag": "ABX9TyOsDMyLzDwWdqCMDu7//XGI",
+      "include_colab_link": true
+    },
+    "kernelspec": {
+      "name": "python3",
+      "display_name": "Python 3"
+    },
+    "language_info": {
+      "name": "python"
+    }
+  },
+  "cells": [
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "view-in-github",
+        "colab_type": "text"
+      },
+      "source": [
+        "<a href=\"https://colab.research.google.com/github/Dom1984/python/blob/master/WoeBot.ipynb\" target=\"_parent\"><img src=\"https://colab.research.google.com/assets/colab-badge.svg\" alt=\"Open In Colab\"/></a>"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "mUa00C6lRb83"
+      },
+      "source": [
+        "# Woebot Analysis"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "Ax0sOCbIrHm4"
+      },
+      "source": [
+        "## Housekeeping"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "GF-u0Uh4Aw2o"
+      },
+      "source": [
+        "Import the relevant libraries and load in the data."
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "nSNRXOvj6aPX"
+      },
+      "source": [
+        "# Import required libraries\n",
+        "import numpy as np\n",
+        "import pandas as pd\n",
+        "import os\n",
+        "from os import path\n",
+        "import matplotlib.pyplot as plt\n",
+        "import seaborn as sns\n",
+        "from scipy.stats import pearsonr\n",
+        "from scipy.stats import shapiro\n",
+        "import scipy.stats as stats"
+      ],
+      "execution_count": 2,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/"
+        },
+        "id": "n6OjJyib7C_9",
+        "outputId": "df81f735-d642-4bb1-d3f9-536fc1bd6884"
+      },
+      "source": [
+        "# 1. Mount Google Drive to access data\n",
+        "from google.colab import drive\n",
+        "drive.mount('/content/drive')"
+      ],
+      "execution_count": 3,
+      "outputs": [
+        {
+          "output_type": "stream",
+          "text": [
+            "Mounted at /content/drive\n"
+          ],
+          "name": "stdout"
+        }
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/",
+          "height": 35
+        },
+        "id": "5c8-QALt7J3Z",
+        "outputId": "bc53dda6-c4bc-4a47-eb7f-305ecff2cb27"
+      },
+      "source": [
+        "# 2. Check current drive\n",
+        "os.getcwd()"
+      ],
+      "execution_count": null,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "application/vnd.google.colaboratory.intrinsic+json": {
+              "type": "string"
+            },
+            "text/plain": [
+              "'/content'"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 3
+        }
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "iQdmtbmq6qMF"
+      },
+      "source": [
+        "# 3. Choose folder where datasets are stored\n",
+        "os.chdir('/content/drive/My Drive/Colab Notebooks/')\n"
+      ],
+      "execution_count": 4,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "db9LdXTR6aUz"
+      },
+      "source": [
+        "# 4. Read in both csv files\n",
+        "survey_responses = pd.read_csv(\"survey_responses.csv\")\n",
+        "user_activty = pd.read_csv(\"user_activity.csv\")"
+      ],
+      "execution_count": 6,
+      "outputs": []
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "IJ70QYHyk9-b"
+      },
+      "source": [
+        "# Data Exploration"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "C0ZtaBu-rncB"
+      },
+      "source": [
+        "Before commencing the three assigned tasks, some basic data exploration is undertaken to understand the structure of the datasets"
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/",
+          "height": 204
+        },
+        "id": "-v2t0T2YS1z5",
+        "outputId": "98e636e8-0256-47a5-93ad-e5ecd7cc7711"
+      },
+      "source": [
+        "survey_responses.head(5)"
+      ],
+      "execution_count": 176,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "text/html": [
+              "<div>\n",
+              "<style scoped>\n",
+              "    .dataframe tbody tr th:only-of-type {\n",
+              "        vertical-align: middle;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe tbody tr th {\n",
+              "        vertical-align: top;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe thead th {\n",
+              "        text-align: right;\n",
+              "    }\n",
+              "</style>\n",
+              "<table border=\"1\" class=\"dataframe\">\n",
+              "  <thead>\n",
+              "    <tr style=\"text-align: right;\">\n",
+              "      <th></th>\n",
+              "      <th>userid</th>\n",
+              "      <th>mobilePlatform</th>\n",
+              "      <th>tenureDay</th>\n",
+              "      <th>waiBondSubscore</th>\n",
+              "    </tr>\n",
+              "  </thead>\n",
+              "  <tbody>\n",
+              "    <tr>\n",
+              "      <th>0</th>\n",
+              "      <td>D2d+QvZOh6hbgFwBR9totchAC5k=</td>\n",
+              "      <td>ios</td>\n",
+              "      <td>5</td>\n",
+              "      <td>2.75</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>1</th>\n",
+              "      <td>UQq1EvExGUr3eEXbGObbiV+Mrtg=</td>\n",
+              "      <td>android</td>\n",
+              "      <td>6</td>\n",
+              "      <td>3.75</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>2</th>\n",
+              "      <td>qVyzInBHD+KDwYneOtRGUIjT17o=</td>\n",
+              "      <td>ios</td>\n",
+              "      <td>4</td>\n",
+              "      <td>3.25</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>3</th>\n",
+              "      <td>TAyM8LnnIjACZL1w3ckYmZZwe3o=</td>\n",
+              "      <td>android</td>\n",
+              "      <td>5</td>\n",
+              "      <td>4.75</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>4</th>\n",
+              "      <td>1vsxQ6OylVGzSrvt8PDMr9UXda4=</td>\n",
+              "      <td>ios</td>\n",
+              "      <td>5</td>\n",
+              "      <td>4.00</td>\n",
+              "    </tr>\n",
+              "  </tbody>\n",
+              "</table>\n",
+              "</div>"
+            ],
+            "text/plain": [
+              "                         userid mobilePlatform  tenureDay  waiBondSubscore\n",
+              "0  D2d+QvZOh6hbgFwBR9totchAC5k=            ios          5             2.75\n",
+              "1  UQq1EvExGUr3eEXbGObbiV+Mrtg=        android          6             3.75\n",
+              "2  qVyzInBHD+KDwYneOtRGUIjT17o=            ios          4             3.25\n",
+              "3  TAyM8LnnIjACZL1w3ckYmZZwe3o=        android          5             4.75\n",
+              "4  1vsxQ6OylVGzSrvt8PDMr9UXda4=            ios          5             4.00"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 176
+        }
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/",
+          "height": 385
+        },
+        "id": "pRyXYE3aXqXg",
+        "outputId": "23490113-5e5c-4ecb-b634-4035cff95c76"
+      },
+      "source": [
+        "sns.displot(survey_responses[[\"tenureDay\", \"waiBondSubscore\"]], x = survey_responses[\"tenureDay\"], bins=16, alpha = 0.5).set(title=\"Distribution count of Tenure day waiBondSubscores were received on\")\n",
+        "plt.show()"
+      ],
+      "execution_count": 177,
+      "outputs": [
+        {
+          "output_type": "display_data",
+          "data": {
+            "image/png": "iVBORw0KGgoAAAANSUhEUgAAAbAAAAFwCAYAAADZpi6eAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4yLjIsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy+WH4yJAAAgAElEQVR4nO3debgcZZn+8e9Nwr4jRwaSQFgCCoyyhMUFRUEIiIKOgzAKwS0i4DKgDoij/EBGfirLIA7IEgHZZRmiwxZRQAWEAGE3EiCQxJAEkGVEQeCZP973kKLpPqdPTp/ufk/uz3X1dbrf2p7qrqq7q7pOlSICMzOz0izV6QLMzMwWhwPMzMyK5AAzM7MiOcDMzKxIDjAzMyuSA8zMzIrUkgCTdJqkf2/RuNaV9L+SRuTXN0j6bCvGncd3taSJrRpfySStJekmSc9LOr7T9bSapAMk/bbTddRTu5y3edote18kzZK0cyvGZe0h6RuSzhyC8bZ9fes3wPIC+te8kXtG0s2SDpT02rARcWBEHNPkuPpc2CPi8YhYKSJeaW4W+pzeUZLOqxn/bhFxzmDH3Q0knS3pO4MYxSTgSWCViDisZtxX5w3s/0r6u6SXKq9PG1Th9oblPH9R+1t+f5/NXyz+sR21SNpT0nRJz0l6UtKvJK3fjmlb+0XEf0REy3YKOqnZPbAPRcTKwHrAccC/AWe1uhhJI1s9TuvTesADUee/2XPQrxQRKwHnA9/rfR0RB7ajuE7snXTYIfn9XgO4AfjpUE9Q0kbAucBhwKrA+sCPgEF/gRxq3b69GGx93T5/XSEi+nwAs4Cda9q2BV4FNs+vzwa+k5+vCfwCeAZ4GvgNKSh/mof5K/C/wNeBsUAAnwEeB26qtI3M47sB+C5wG/AccCWwRu62IzCnXr3ABOAl4O95endXxvfZ/Hwp4JvAY8AC0oq8au7WW8fEXNuTwJF9vE/LA8fncT0L/BZYPnf7MHB/fk9uAN5aGS6AjSqvq+/ljsAc0sZlATAP+FTuNinP20t5/n7eoK53Arfnmm4H3lmZTnX4nfuYt9dqyq/3AKbn+bkZeFvN+/9V4J48zYuB5XK3A4Df1oz7tfnP0zkVuAr4S/4c1wEuAxYCjwJf6qPONwFT8nJyG3BMdXrAfwKzc/c7gB1y+z8ALwBvqvS7VZ7m0jXTWI60DK+ZXx8JvEzaiyVP86T8/IPAXXl6s4GjKuMZyxuX889Wum8KvFR5vSxwEvCn/DgJWLa/5aS/9wX4GDB9AJ/9jlTWufx5HwE8APwZ+Enl8667LcjdxgCX5/f4KeCUAayTr20vcvungQfz9K8F1svtAk7M43kOuJe8zaqZx/cB91ZeTwVur7z+DbBXft5weQSOAi4FzsvT+yzpS8FZ+TOZC3wHGNHgvR7w8MDn8rw/nz+DrZqs87z8/GrSF6dqHXcDH83P35Lfj6eBGcDeza5vdeavr+3gLBpsN/p6LFaA5fbHgS/U2eh+FzgNWDo/dgBUb1wsWiDPBVYkhUBvW3XFngtsnvu5rPLm70iDAKv9oCrdb2BRgH0amAlsAKxEWqF+WlPbGbmutwMvVt/0mvH+KI97FDCCFBzLAhuTNsYfyO/H1/M0l6ndgNd5L3ckbRyPzsPuTtrQrl5v41KnpjVIK/V+wEhg3/z6Tc0M36CmLUkbhO3yfE7M73nvxnQWaWFeJ0//QeDA3O0A+g+wZ4F3kTZkK5CC5lvAMvlzegTYtUGdFwGX5OVkc9JyUw2wT5JWupGkjf0TLNrYXkVenvPrE4EfNpjOTcA/5efXAQ8Du1W6faTy+f1jnpe3AfNZtCEcS4MAy/N6LHkDnduOBm4F3gz0kL44HNPkctLwfcnv6d/y/L4PWKnRZ19vncuf932kQFoD+B39bAtIy83deZorkr4UvHsA62R1e7Fn7v+t+XP9JnBz7n9X0vKzWp7uW4G163yey+f3YM1c5/z8Hq2cu/2VtNwsRR/LI2l783dgr9zv8sAVwI9zvW8mrRufb7BcDWh44J9zndvk+duIdFSlmTp7t6H7A7+r1LApKWCWzdOcDXwqv7dbkr7Ib9rM+lYzb/1tB2fRYLsxVAF2K3mPhNdv4I4m7SVt1N+4WLRAblCnrbpiH1fzBr9EWgl2ZHABdj1wUKXbJnkBGlmpY3Sl+23APnXmaynSQv72Ot3+Hbikpt+5wI61G/A67+WOebwjK90XANvX27jUmfZ+wG01bbcABzQzfIOaTiVvOCvdZwDvrbz/n6x0+x5wWn5+AP0H2LmVbtsBj9f0fwTwkzo1jsif3Vsqbf9RO72aYf7c+5kBHyevyHlcTwDbNhjuGODkvJw8AXyZdGi9d+/sTQ2GOwk4sY/l/AXSxuNFUpDvVBn2YWD3yutdgVn9LSfNvC+5v0tI39b/lj+HleotI9QPsAMrr3cHHu5rWwC8I09rZJ33qJl1srq9uBr4TM369QJpQ/5+4I95/pbqZxn/DfDR3O91+f2YQAr1e5pZHknbm+qXjrXyZ7l8pW1f4NcNahjQ8KS9zS/XGU8zdfYG2MqkYFkvvz4WmFxZJ35TM54fA99uZrmqGa6/7eAsGmw3+noM5izEUaTdylrfJyXrdZIekXR4E+OaPYDuj5ESfM2mquzbOnl81XGPJC04vZ6oPH+B9K2w1pqkjdfD/U0jIl4lzc+oJmt8KiJebqKGemrnj/y62WnXsx5wWD6h5xlJz5C+fa9T6aeZ96yR6me9HrBOzbS+wes/n149pM+udll5jaSvSnownyTxDOnwTO9ydCWwaT554QPAsxFxW4MabyRtyLciHZaaCryXtPGbGRFP5eltJ+nXkhZKehY4kL6X2y9FxGqkb957AJdKelvuVm9Zrb7njZaTft+XiLg1IvaOiB7SXtJ7SIdGm1U77t66Gm0LxgCP1dTbq5l1snYZ+c/K8vE0aW9kVET8CjiFdHRkgaTTJa3SYB56P9P35Oc3kD7T9+bXvdPqb3msrW1pYF6l/x+T9qQaGcjwY6i/zWl6vYmI54H/AfbJTfuSfvPuHc92NeP5BOmQe7/LVY1mtoMD3m4sVoBJ2iZP+A2nTEbE8xFxWERsQDrmeaiknXo7Nxhlo/ZeYyrP1yUl/5Okbw4rVOoaQXpjmx3vn0gfUnXcL5MOIQzEk6Rvrhv2Nw1JIs3P3Nz0ApV5IC0czRro/EGax7l1+m3WbODYiFit8lghIi5sYtjaz6vevFbnaTbwaM20Vo6I3esMt5D02dUuK73T2oF02GJv0qG11Uh7OQKIiL+RvnV/krTn2tcJFDeT9gw+AtwYEQ/kae3Ooo0dwAWk3wjGRMSqpMNp6mO85FpejYjfkDb+u+Tmesvqn/obF/28L3WmfTvpsN3muel1nxn1l8/acf8pj6vRtmA2sG6DkxSaWSdrl5HP1ywjy0fEzbmGkyNia9KRm42BrzWY9doAu5E3Blgzy2NtbS+Sfi/t7X+ViNisQQ0DHX429bc5A1lvAC4E9pX0DtIX8V9XxnNjzXhWiogvMMDliv63g4tlQAEmaRVJe5COfZ4XEffW6WcPSRvlAp8lnc30au48n3Q8dqA+KWlTSSuQDktcGun04z8Cy0n6oKSlSce/l60MNx8YWz3lv8aFwL9KWl/SSqRd4IsbfDNsKH+bmAycIGkdSSMkvUPSsqSN4gcl7ZRrPIy0UN6cB58O/EseZgJphWlWf+/nVcDGkv5F0khJHyetyL8YyPzVOAM4MO9dSNKK+f1fuYlh7wY2k7SFpOVIhzL6chvwvKR/k7R8fo82z1+gXicvD5cDR0laQdKmpN/neq1MWuEWAiMlfQuo/TZ+Lukw54fpI8Ai4gXSbwwHs2jjdjNpD6saYCsDT0fE3yRtC/xLP/P7mrwx2ZT0ozekZfWbknokrUn6feO8RsNXau3zfZH0bkmfk/Tm/PotpPm/NfcyHdhd0hr5C8dX6kzmYEmjJa1B2nO7OI+r0bbgNtJJCcfl5Wc5Se+qzOdA1snTgCMkbZanuaqkf87Pt8nL6dKkIP4bi7ZFtXq/lGxLOux+P3kPhPS7JgxgeQSIiHmkw5HH523nUpI2lNTUOt7E8GcCX5W0dV4XN5K03kDrJG0n1iNtWy/O2zNI24mNJe0naen82EbSW5tY32r1tx1cLM0G2M8lPU9K5COBE0g/7NUzDvgl6cy2W4D/iojeRP8uaSV8RtJXB1DnT0nH4p8gfUP4EkBEPAscRPog55IW0jmV4X6W/z4l6c46452cx30T6UydvwFfHEBdVV8lHU66nXQY4/+TjrvPIH2r/yFpT+1DpH9LeCkP9+Xc1rt7/t8DmOZZpMNez0h6w3D5UNYepIXlKdIeyB4R8eTAZ++1cU4jnfl0Cuk3pJmkjX4zw/6RtJL8EniIOnvwNf2/Qqp/C9Ln8yTps161wSCHkA47PEFaXn5S6XYtcA3pS89jpM/6dYeuI+J3pA3cnRHR1+EQSEG1NGlj0ft6ZRZt7CAtm0fndedbpJW4L6co/68dabn8ZkRcnbt9B5hGOkvrXuDO3NaMvt6XZ0iBdW+e7jWkEwe+l7v/lPTFYxZpY3pxnfFfkLs9Qjqk1VtX3W1B/lw/RDrp4HHSOvvxPMyA1smIuIK0rl0k6TnSCSW75c6rkL5w/Zn0mT9FOqxZbzx/Ib2n91fWzVtIhzoX5H4GujxCOkliGRadpXkpsHYf/Tc9fET8jPSb1QWksxD/m3SG9oDqjIgXSWG0cx5Xb/vzpCMA+5D2oJ4gvde9Owl9LVe10+hvO7hYes8ONDNA0q+ACyKi5VcqMLPWcoCZZfkQy1TSb1bPd7oeM+ubL+ZrBkg6h3S46ysOL7MyeA/MzMyK5D0wMzMrki8W2cCECRPimmuu6XQZZmbQxP8PLom8B9bAk08u9pnmZmbWBg4wMzMrkgPMzMyK5AAzM7MiOcDMzKxIDjAzMyuSA8zMzIrU1QEmaYzSDQEfkHS/pC/n9jUkTZX0UP67em6XpJMlzZR0j6StKuOamPt/SFJfl/03M7MCdHWAke7fdFhEbEq62+3B+b4zhwPXR8Q40i3Ie+/0uhvpFg7jgEnAqZACj3Qb7O1I9/v5dm/omZlZmbo6wCJiXkTcmZ8/DzxIuhP0nsA5ubdzgL3y8z2BcyO5FVhN0trArsDUiHg6Iv5MuuL4hDbOipmZtVhXB1iVpLHAlsDvgbXy3Uoh3Uxtrfx8FK+/SeGc3NaovXYakyRNkzRt4cKFLa3fzMxaq4gAy7cWv4x0q4vnqt0iXU6/JZfUj4jTI2J8RIzv6elpxSjNzGyIdH2ASVqaFF7nR8TluXl+PjRI/rsgt88FxlQGH53bGrWbmVmhujrAJAk4C3gwIk6odJoC9J5JOBG4stK+fz4bcXvg2Xyo8VpgF0mr55M3dsltZmZWqK4OMOBdwH7A+yVNz4/dgeOAD0h6CNg5vwa4CngEmAmcARwEEBFPA8cAt+fH0bmt64xZdz0kLfZjzLrrdXoWzMzawndkbmD8+PExbdq0tk9XEidcN2Oxhz90l03wZ2o27Ph+YHV0+x6YmZlZXQ4wMzMrkgPMzMyK5AAzM7MiOcDMzKxIDjAzMyuSA8zMzIrkADMzsyI5wMzMrEgOMDMzK5IDzMzMiuQAa6HBXog3XXzfzMyaMbLTBQwnc2Y/PqgL8UK6GK+ZmfXPe2BmZlYkB5iZmRXJAWZmZkVygJmZWZEcYGZmViQHmJmZFckBZmZmRXKAmZlZkRxgZmZWJAeYmZkVyQFmZmZFcoCZmVmRHGBmZlYkB5iZmRXJAWZmZkXq6gCTNFnSAkn3VdouljQ9P2ZJmp7bx0r6a6XbaZVhtpZ0r6SZkk6W7xxpZla8br+h5dnAKcC5vQ0R8fHe55KOB56t9P9wRGxRZzynAp8Dfg9cBUwArh6Ces3MrE26eg8sIm4Cnq7XLe9F7Q1c2Nc4JK0NrBIRt0ZEkMJwr1bXamZm7dXVAdaPHYD5EfFQpW19SXdJulHSDrltFDCn0s+c3PYGkiZJmiZp2sKFC4emajMza4mSA2xfXr/3NQ9YNyK2BA4FLpC0ykBGGBGnR8T4iBjf09PTwlLNzKzVuv03sLokjQQ+Cmzd2xYRLwIv5ud3SHoY2BiYC4yuDD46t5mZWcFK3QPbGfhDRLx2aFBSj6QR+fkGwDjgkYiYBzwnafv8u9n+wJWdKNrMzFqnqwNM0oXALcAmkuZI+kzutA9vPHnjPcA9+bT6S4EDI6L3BJCDgDOBmcDD+AxEM7PidfUhxIjYt0H7AXXaLgMua9D/NGDzlhZnZmYd1dV7YGZmZo04wMzMrEgOMDMzK5IDzMzMiuQAMzOzIjnAzMysSA4wMzMrkgPMzMyK5AAzM7MiOcDMzKxIDjAzMyuSA8zMzIrkADMzsyI5wMzMrEgOMDMzK5IDzMzMiuQAMzOzIjnAzMysSA4wMzMrkgPMzMyK5AAzM7MiOcDMzKxIDjAzMyuSA8zMzIrkADMzsyI5wMzMrEgOMDMzK5IDzMzMitTVASZpsqQFku6rtB0laa6k6fmxe6XbEZJmSpohaddK+4TcNlPS4e2eDzMza72uDjDgbGBCnfYTI2KL/LgKQNKmwD7AZnmY/5I0QtII4EfAbsCmwL65XzMzK9jIThfQl4i4SdLYJnvfE7goIl4EHpU0E9g2d5sZEY8ASLoo9/tAi8s1M7M26vY9sEYOkXRPPsS4em4bBcyu9DMntzVqfwNJkyRNkzRt4cKFQ1G3mZm1SIkBdiqwIbAFMA84vlUjjojTI2J8RIzv6elp1WjNzGwIdPUhxHoiYn7vc0lnAL/IL+cCYyq9js5t9NFuZmaFKm4PTNLalZcfAXrPUJwC7CNpWUnrA+OA24DbgXGS1pe0DOlEjyntrNnMzFqvq/fAJF0I7AisKWkO8G1gR0lbAAHMAj4PEBH3S7qEdHLGy8DBEfFKHs8hwLXACGByRNzf5lkxM7MW6+oAi4h96zSf1Uf/xwLH1mm/CriqhaWZmVmHFXcI0czMDBxgZmZWKAeYmZkVyQFmZmZFcoCZmVmRHGBmZlYkB5iZmRXJAWZmZkVygJmZWZEcYGZmViQHmJmZFckBZmZmRXKAmZlZkRxgZmZWJAeYmZkVyQFmZmZFcoCZmVmRHGBmZlYkB5iZmRXJAWZmZkVygJmZWZEcYGZmViQHmJmZFckBZmZmRXKAmZlZkRxgZmZWJAeYmZkVyQFmZmZF6uoAkzRZ0gJJ91Xavi/pD5LukXSFpNVy+1hJf5U0PT9OqwyztaR7Jc2UdLIkdWJ+zMysdbo6wICzgQk1bVOBzSPibcAfgSMq3R6OiC3y48BK+6nA54Bx+VE7TjMzK0xXB1hE3AQ8XdN2XUS8nF/eCozuaxyS1gZWiYhbIyKAc4G9hqJeMzNrn64OsCZ8Gri68np9SXdJulHSDrltFDCn0s+c3PYGkiZJmiZp2sKFC4emYjMza4liA0zSkcDLwPm5aR6wbkRsCRwKXCBplYGMMyJOj4jxETG+p6entQWbmVlLjex0AYtD0gHAHsBO+bAgEfEi8GJ+foekh4GNgbm8/jDj6NxmZmYFK24PTNIE4OvAhyPihUp7j6QR+fkGpJM1HomIecBzkrbPZx/uD1zZgdLNzKyFunoPTNKFwI7AmpLmAN8mnXW4LDA1nw1/az7j8D3A0ZL+DrwKHBgRvSeAHEQ6o3F50m9m1d/NzMysQF0dYBGxb53msxr0exlwWYNu04DNW1iamZl1WHGHEM3MzMABZmZmhXKAmZlZkRxgZmZWJAeYmZkVyQFmZmZFcoCZmVmRHGBmZlYkB5iZmRXJAWZmZkVygJmZWZEcYGZmViQHmJmZFckBZmZmRWpLgEl6VzNtZmZmzWrXHtgPm2wzMzNrypDe0FLSO4B3Aj2SDq10WgUYMZTTNjOz4W2o78i8DLBSns7KlfbngI8N8bTNzGwYG9IAi4gbgRslnR0Rjw3ltMzMbMky1HtgvZaVdDowtjrNiHh/m6ZvZmbDTLsC7GfAacCZwCttmqaZmQ1j7QqwlyPi1DZNy8zMlgDtOo3+55IOkrS2pDV6H22atpmZDUPt2gObmP9+rdIWwAZtmr6ZmQ0zbQmwiFi/HdMxM7MlR1sCTNL+9doj4tx2TN/MzIafdh1C3KbyfDlgJ+BOwAFmZmaLpV2HEL9YfS1pNeCidkzbzMyGp07dTuUvQL+/i0maLGmBpPsqbWtImirpofx39dwuSSdLminpHklbVYaZmPt/SNLEetMyM7OytOt2Kj+XNCU//geYAVzRxKBnAxNq2g4Hro+IccD1+TXAbsC4/JgEnJqnvQbwbWA7YFvg272hZ2Zm5WrXb2A/qDx/GXgsIub0N1BE3CRpbE3znsCO+fk5wA3Av+X2cyMigFslrSZp7dzv1Ih4GkDSVFIoXriY82JmZl2gLXtg+aK+fyBdkX514KVBjG6tiJiXnz8BrJWfjwJmV/qbk9satb+BpEmSpkmatnDhwkGUaGZmQ61dhxD3Bm4D/hnYG/i9pEHfTiXvbcVgx1MZ3+kRMT4ixvf09LRqtGZmNgTadQjxSGCbiFgAIKkH+CVw6WKMa76ktSNiXj5EuCC3zwXGVPobndvmsuiQY2/7DYsxXTMz6yLtOgtxqd7wyp4axLSnsOjSVBOBKyvt++ezEbcHns2HGq8FdpG0ej55Y5fcZmZmBWvXHtg1kq5l0YkTHweu6m8gSReS9p7WlDSHdDbhccAlkj4DPEY6JEke3+7ATOAF4FMAEfG0pGOA23N/R/ee0GFmZuUa0gCTtBHppIuvSfoo8O7c6Rbg/P6Gj4h9G3TaqU6/ARzcYDyTgclNFW1mZkUY6j2wk4AjACLicuByAEn/mLt9aIinb2Zmw9RQ/wa2VkTcW9uY28YO8bTNzGwYG+oAW62PbssP8bTNzGwYG+oAmybpc7WNkj4L3DHE0zYzs2FsqH8D+wpwhaRPsCiwxgPLAB8Z4mmbmdkwNqQBFhHzgXdKeh+weW7+n4j41VBO18zMhr923Q/s18Cv2zEtMzNbMnTqfmBmZmaD4gAzM7MiOcDMzKxIDjAzMyuSA8zMzIrkADMzsyI5wMzMrEgOMDMzK5IDzMzMiuQAMzOzIjnAzMysSA4wMzMrkgPMzMyK5AAzM7MiOcDMzKxIDjAzMyuSA8zMzIrkADMzsyI5wMzMrEgOMDMzK5IDzMzMilRkgEnaRNL0yuM5SV+RdJSkuZX23SvDHCFppqQZknbtZP1mZjZ4IztdwOKIiBnAFgCSRgBzgSuATwEnRsQPqv1L2hTYB9gMWAf4paSNI+KVthZuZmYtU+QeWI2dgIcj4rE++tkTuCgiXoyIR4GZwLZtqc7MzIbEcAiwfYALK68PkXSPpMmSVs9to4DZlX7m5DYzMytU0QEmaRngw8DPctOpwIakw4vzgOMHOL5JkqZJmrZw4cKW1mpmZq1VdIABuwF3RsR8gIiYHxGvRMSrwBksOkw4FxhTGW50bnudiDg9IsZHxPienp4hLt3MzAaj9ADbl8rhQ0lrV7p9BLgvP58C7CNpWUnrA+OA29pWpZmZtVyRZyECSFoR+ADw+Urz9yRtAQQwq7dbRNwv6RLgAeBl4GCfgWhmVrZiAywi/gK8qaZtvz76PxY4dqjrMjOz9ij9EKKZmS2hHGBmZlYkB5iZmRXJAWZmZkVygJmZWZEcYGZmViQHmJmZFckBZmZmRXKAmZlZkRxgZmZWJAeYmZkVyQFmZmZFcoCZmVmRHGBmZlYkB5iZmRXJAWZmZkVygJmZWZEcYGZmViQHmJmZFckBZmZmRXKAmZlZkRxgZmZWJAeYmZkVyQFmZmZFcoCZmVmRHGBmZlYkB5iZmRXJAWZmZkUqNsAkzZJ0r6TpkqbltjUkTZX0UP67em6XpJMlzZR0j6StOlu9mZkNVrEBlr0vIraIiPH59eHA9RExDrg+vwbYDRiXH5OAU9teqZmZtVTpAVZrT+Cc/PwcYK9K+7mR3AqsJmntThQ45LQUkgb1GLPuep2eCzOzfo3sdAGDEMB1kgL4cUScDqwVEfNy9yeAtfLzUcDsyrBzcts8hpt4lROumzGoURy6yyYtKsbMbOiUHGDvjoi5kt4MTJX0h2rHiIgcbk2TNIl0iJF11123dZWamVnLFXsIMSLm5r8LgCuAbYH5vYcG898Fufe5wJjK4KNzW+04T4+I8RExvqenZyjLNzOzQSoywCStKGnl3ufALsB9wBRgYu5tInBlfj4F2D+fjbg98GzlUKOZmRWo1EOIawFXSII0DxdExDWSbgcukfQZ4DFg79z/VcDuwEzgBeBT7S/ZzMxaqcgAi4hHgLfXaX8K2KlOewAHt6E0MzNrkyIPIZqZmTnAzMysSA4wMzMrkgPMzMyK5AAzM7MiOcDMzKxIDjAzMyuSA8zMlhhj1l3Pd2oYRor8R2Yzs8UxZ/bjg7pbg+/U0F28B2ZmZkVygJmZWZEcYGZmViQHmJkVYbAnYOS7V9gw4pM4zKwIgz0BA3wSxnDjPTAzMyuSA8zMzIrkADMzsyI5wMzMrEgOMDMzK5IDzMzMiuQAMzOzIjnAzMysSA4wMzMrkgPMzMyK5AAzM7MiOcDMzKxIDjAzMyuSA8zMzIrkADMzsyIVGWCSxkj6taQHJN0v6cu5/ShJcyVNz4/dK8McIWmmpBmSdu1c9WZm1gql3tDyZeCwiLhT0srAHZKm5m4nRsQPqj1L2hTYB9gMWAf4paSNI+KVtlZtZmYtU+QeWETMi4g78/PngQeBUX0MsidwUUS8GBGPAjOBbYe+UjMzGypFBliVpLHAlsDvc9Mhku6RNFnS6rltFDC7Mtgc6gSepEmSpkmatnDhwiGs2szMBqvoAJO0EnAZ8JWIeA44FdgQ2AKYBxw/kPFFxOkRMT4ixvf09LS8XjMza51iA0zS0qTwOj8iLgeIiPkR8UpEvAqcwaLDhHOBMZXBR+c2MzMrVJEBJknAWcCDEXFCpX3tSm8fAe7Lz6cA+0haVtL6wDjgtnbVa2ZmrVfqWYjvAvYD7pU0Pbd9A9hX0hZAALOAzwNExP2SLgEeIJ3BeLDPQDQzK1uRARYRvwVUp9NVfQxzLHDskBVlZmZtVeQhRPGycxYAAAeaSURBVDMzMweYmZkVyQFmZmZFcoCZmVmRHGBmZlYkB5iZmRXJAWZmZkVygJmZWZEcYGZmViQHmJmZFckBZmbWLC2FpEE9xqy7XqfnYtgo8lqIZmYdEa9ywnUzBjWKQ3fZpEXFmPfAzMysSA4wMzMrkgPMzMyK5AAzM7MiOcDMzKxIDjAzMyuSA8zMzIrkADMzsyI5wMzMrEgOMDMzK5IDzMzMiuQAMzOzIjnAzMysSA4wMzMrkgPMzMyK5AAzM7MiLTEBJmmCpBmSZko6vNP1mJnZ4CwRASZpBPAjYDdgU2BfSZt2tiozMxuMJSLAgG2BmRHxSES8BFwE7NnhmszMbBAUEZ2uYchJ+hgwISI+m1/vB2wXEYfU9DcJmJRfbgLMGOCk1gSeHGS57VZaza53aJVWL5RX8+LU+2RETBiKYko2stMFdJOIOB04fXGHlzQtIsa3sKQhV1rNrndolVYvlFdzafV2syXlEOJcYEzl9ejcZmZmhVpSAux2YJyk9SUtA+wDTOlwTWZmNghLxCHEiHhZ0iHAtcAIYHJE3D8Ek1rsw48dVFrNrndolVYvlFdzafV2rSXiJA4zMxt+lpRDiGZmNsw4wMzMrEgOsBaSNELSXZJ+0ela+iNpNUmXSvqDpAclvaPTNfVF0r9Kul/SfZIulLRcp2uqJWmypAWS7qu0rSFpqqSH8t/VO1ljVYN6v5+XiXskXSFptU7WWFWv3kq3wySFpDU7UVsjjWqW9MX8Pt8v6Xudqq90DrDW+jLwYKeLaNJ/AtdExFuAt9PFdUsaBXwJGB8Rm5NOxNmns1XVdTZQ+8+mhwPXR8Q44Pr8uluczRvrnQpsHhFvA/4IHNHuovpwNm+sF0ljgF2Ax9tdUBPOpqZmSe8jXQno7RGxGfCDDtQ1LDjAWkTSaOCDwJmdrqU/klYF3gOcBRARL0XEM52tql8jgeUljQRWAP7U4XreICJuAp6uad4TOCc/PwfYq61F9aFevRFxXUS8nF/eSvqfya7Q4P0FOBH4OtB1Z6Q1qPkLwHER8WLuZ0HbCxsmHGCtcxJpJXq104U0YX1gIfCTfMjzTEkrdrqoRiJiLulb6uPAPODZiLius1U1ba2ImJefPwGs1cliBujTwNWdLqIvkvYE5kbE3Z2uZQA2BnaQ9HtJN0raptMFlcoB1gKS9gAWRMQdna6lSSOBrYBTI2JL4C9016Gt18m/G+1JCt51gBUlfbKzVQ1cpP9Z6bq9hHokHQm8DJzf6VoakbQC8A3gW52uZYBGAmsA2wNfAy6RpM6WVCYHWGu8C/iwpFmkK92/X9J5nS2pT3OAORHx+/z6UlKgdaudgUcjYmFE/B24HHhnh2tq1nxJawPkv11/uEjSAcAewCeiu/9RdEPSl5q787o3GrhT0j90tKr+zQEuj+Q20lGbrjr5pBQOsBaIiCMiYnREjCWdXPCriOjaPYSIeAKYLWmT3LQT8EAHS+rP48D2klbI31R3ootPOqkxBZiYn08EruxgLf2SNIF0KPzDEfFCp+vpS0TcGxFvjoixed2bA2yVl+9u9t/A+wAkbQwsQ1lX0+8aDrAl1xeB8yXdA2wB/EeH62ko7yleCtwJ3EtabrvucjySLgRuATaRNEfSZ4DjgA9Ieoi0J3lcJ2usalDvKcDKwFRJ0yWd1tEiKxrU29Ua1DwZ2CCfWn8RMLHL93S7li8lZWZmRfIemJmZFckBZmZmRXKAmZlZkRxgZmZWJAeYmZkVyQFmS6R8Nf6DOjj9HSU9my/lNUPSTfmKLmbWJAeYLalWA4Y0wPKFh/vym4jYMiI2IV1t/xRJOw1lTWbDiQPMllTHARvmf9b9vqSvSbo93wfr/wFIGpvvlXZGvm/TdZKWz91ukDQ+P18zX8oISQdImiLpV8D1klbM94S6Le9t7VmvmIiYDhwNHJLH86F8sde7JP1S0lqSlsr3FevJ/SwlaWbva7MljQPMllSHAw9HxBake2CNA7YlXZVka0nvyf2NA36U79v0DPBPTYx7K+BjEfFe4EjSpcW2JV0+6Pt9XPn/TuAt+flvge3zxZYvAr4eEa8C5wGfyP3sDNwdEQubnWmz4aS/QxxmS4Jd8uOu/HolUnA9TrqI8PTcfgcwtonxTY2I3ntA7UK60PNX8+vlgHUbDFe9Ivlo4OJ8AeBlgEdz+2TS9RRPIt3u5CdN1GM2LDnAzFJwfDcifvy6Rmks8GKl6RVg+fz8ZRYdwViuZnx/qRn3P0XEjJpx17sv2JYsukjxD4ETImKKpB2BowAiYrak+ZLeT9pj/ESd8ZgtEXwI0ZZUz5MuWgtwLfBpSSsBSBol6c39DD8L2Do//1gf/V0LfLH3fk+StqzXk6S3Af8O/Cg3rQrMzc8n1vR+JulQ4s8i4pV+6jQbthxgtkSKiKeA3+Urgn8AuAC4RdK9pCvfr9zX8KQ7RH9B0l30fS+nY4ClgXsk3Z9f99qh9zR6UnB9KSKuz92OAn4m6Q7eeKuNKaTDnD58aEs0X43erDD57McTI2KHTtdi1kn+DcysIJIOB76Af/sy8x6YmZmVyb+BmZlZkRxgZmZWJAeYmZkVyQFmZmZFcoCZmVmR/g/tfWvrayixDgAAAABJRU5ErkJggg==\n",
+            "text/plain": [
+              "<Figure size 360x360 with 1 Axes>"
+            ]
+          },
+          "metadata": {
+            "tags": [],
+            "needs_background": "light"
+          }
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "9b_rRq84ZwDR"
+      },
+      "source": [
+        "The distribution of the volume of scores assigned on certain days is imbalanced, there are a much higher volume of bond scores received on days 4, 5 than on any other days.\n",
+        "\n",
+        "This may have been due to how the data was collected, or perhaps there was a push to get partcipants to log a score on those days."
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "FjGC1c3D7gO2",
+        "colab": {
+          "base_uri": "https://localhost:8080/",
+          "height": 297
+        },
+        "outputId": "71f2876d-bba0-4db7-c9bb-3a70c64cfb8e"
+      },
+      "source": [
+        "survey_responses.describe()"
+      ],
+      "execution_count": 111,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "text/html": [
+              "<div>\n",
+              "<style scoped>\n",
+              "    .dataframe tbody tr th:only-of-type {\n",
+              "        vertical-align: middle;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe tbody tr th {\n",
+              "        vertical-align: top;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe thead th {\n",
+              "        text-align: right;\n",
+              "    }\n",
+              "</style>\n",
+              "<table border=\"1\" class=\"dataframe\">\n",
+              "  <thead>\n",
+              "    <tr style=\"text-align: right;\">\n",
+              "      <th></th>\n",
+              "      <th>tenureDay</th>\n",
+              "      <th>waiBondSubscore</th>\n",
+              "    </tr>\n",
+              "  </thead>\n",
+              "  <tbody>\n",
+              "    <tr>\n",
+              "      <th>count</th>\n",
+              "      <td>5311.000000</td>\n",
+              "      <td>5311.000000</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>mean</th>\n",
+              "      <td>6.460930</td>\n",
+              "      <td>3.836613</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>std</th>\n",
+              "      <td>3.892763</td>\n",
+              "      <td>0.768943</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>min</th>\n",
+              "      <td>4.000000</td>\n",
+              "      <td>1.000000</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>25%</th>\n",
+              "      <td>4.000000</td>\n",
+              "      <td>3.250000</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>50%</th>\n",
+              "      <td>5.000000</td>\n",
+              "      <td>4.000000</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>75%</th>\n",
+              "      <td>6.000000</td>\n",
+              "      <td>4.500000</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>max</th>\n",
+              "      <td>16.000000</td>\n",
+              "      <td>5.000000</td>\n",
+              "    </tr>\n",
+              "  </tbody>\n",
+              "</table>\n",
+              "</div>"
+            ],
+            "text/plain": [
+              "         tenureDay  waiBondSubscore\n",
+              "count  5311.000000      5311.000000\n",
+              "mean      6.460930         3.836613\n",
+              "std       3.892763         0.768943\n",
+              "min       4.000000         1.000000\n",
+              "25%       4.000000         3.250000\n",
+              "50%       5.000000         4.000000\n",
+              "75%       6.000000         4.500000\n",
+              "max      16.000000         5.000000"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 111
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "xOd1U1jdZU9S"
+      },
+      "source": [
+        "The Highest bond score is 5 and the lowest is 1.\n",
+        "\n",
+        "Let's check the mean average bond score by day:"
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/"
+        },
+        "id": "01if-0TI7gUT",
+        "outputId": "41b81f65-18ec-45fa-bc4f-83eb7e94aa45"
+      },
+      "source": [
+        "survey_responses.groupby(\"tenureDay\")[\"waiBondSubscore\"].mean()"
+      ],
+      "execution_count": 246,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "text/plain": [
+              "tenureDay\n",
+              "4     3.812401\n",
+              "5     3.791287\n",
+              "6     3.755371\n",
+              "14    4.037109\n",
+              "15    4.046875\n",
+              "16    3.925725\n",
+              "Name: waiBondSubscore, dtype: float64"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 246
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "uhYziXFdZlMu"
+      },
+      "source": [
+        "Initial analysis of the mean score by tenure day, suggests that scores improve later in the tenure period, compared with the earlier days. It must be noted that we have previously seen the sample sizes for the days are very different.  "
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "qHs0tsaSb-e3"
+      },
+      "source": [
+        "# Task 1 - Does the reported measure of bond change over time?"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "9R3oqKy3s2LJ"
+      },
+      "source": [
+        "To measure whether bond changes over time, I will do the following:\n",
+        "\n",
+        "\n",
+        "1.   Pivot the surey_responses dataset to observe which participants submitted two bond scores\n",
+        "2.   Add a column at the end of this pivot table, to calculate the change in bond score. This is calculated by deducting the first score from the second (where there are two)\n",
+        "3.   Calculating the mean of the 'Change' metric to understand the change in bond score over time\n",
+        "4.   Examine the distribution of scores for users who submitted one bond score and those who submitted two\n"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "q10f77SilPtn"
+      },
+      "source": [
+        "The survey data is in long format, this can be pivotted."
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "l52ib8amAQGl"
+      },
+      "source": [
+        "# Pivot the dataframe to look at both scores for a given user, where applicable:\n",
+        "pivot_survey = survey_responses.pivot_table('waiBondSubscore', index =\"userid\", columns =\"tenureDay\") "
+      ],
+      "execution_count": 178,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/",
+          "height": 235
+        },
+        "id": "ehPjtcZJBpks",
+        "outputId": "341e0731-777d-44e9-c7f0-c861671c9e5a"
+      },
+      "source": [
+        "pivot_survey.head(5)"
+      ],
+      "execution_count": 179,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "text/html": [
+              "<div>\n",
+              "<style scoped>\n",
+              "    .dataframe tbody tr th:only-of-type {\n",
+              "        vertical-align: middle;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe tbody tr th {\n",
+              "        vertical-align: top;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe thead th {\n",
+              "        text-align: right;\n",
+              "    }\n",
+              "</style>\n",
+              "<table border=\"1\" class=\"dataframe\">\n",
+              "  <thead>\n",
+              "    <tr style=\"text-align: right;\">\n",
+              "      <th>tenureDay</th>\n",
+              "      <th>4</th>\n",
+              "      <th>5</th>\n",
+              "      <th>6</th>\n",
+              "      <th>14</th>\n",
+              "      <th>15</th>\n",
+              "      <th>16</th>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>userid</th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "    </tr>\n",
+              "  </thead>\n",
+              "  <tbody>\n",
+              "    <tr>\n",
+              "      <th>+/wAfc2I0c831C21wvh2Kcr4DZk=</th>\n",
+              "      <td>4.25</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>4.0</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0NdvBGRsXuoa20PHou4K3FMlBA=</th>\n",
+              "      <td>NaN</td>\n",
+              "      <td>3.75</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0eFEPPuFJm9U5lXwlAKw/I+Clo=</th>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>3.75</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0pfU/ormz318pPBTZ6cWtrgHkI=</th>\n",
+              "      <td>NaN</td>\n",
+              "      <td>5.00</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>5.0</td>\n",
+              "      <td>NaN</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+11s2fkg+oFKje/WvOYnzxbYgtY=</th>\n",
+              "      <td>4.50</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "    </tr>\n",
+              "  </tbody>\n",
+              "</table>\n",
+              "</div>"
+            ],
+            "text/plain": [
+              "tenureDay                       4     5     6    14   15  16\n",
+              "userid                                                      \n",
+              "+/wAfc2I0c831C21wvh2Kcr4DZk=  4.25   NaN   NaN  4.0  NaN NaN\n",
+              "+0NdvBGRsXuoa20PHou4K3FMlBA=   NaN  3.75   NaN  NaN  NaN NaN\n",
+              "+0eFEPPuFJm9U5lXwlAKw/I+Clo=   NaN   NaN  3.75  NaN  NaN NaN\n",
+              "+0pfU/ormz318pPBTZ6cWtrgHkI=   NaN  5.00   NaN  NaN  5.0 NaN\n",
+              "+11s2fkg+oFKje/WvOYnzxbYgtY=  4.50   NaN   NaN  NaN  NaN NaN"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 179
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "9HEW3PQVma1V"
+      },
+      "source": [
+        " Creating a new column 'Change' to track the change in bond score over tenure days."
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "3AU28DfALIZi"
+      },
+      "source": [
+        "df = pivot_survey.reset_index(drop=True)\n",
+        "for index in df.index:\n",
+        "    row = df.iloc[index]\n",
+        "    nonNaValuesInRow = df.iloc[index].dropna()\n",
+        "    accumulated = np.nan\n",
+        "    for value in nonNaValuesInRow:      # Assumption that there are only 2 values (two timepoints)\n",
+        "      if len(nonNaValuesInRow) > 1:\n",
+        "        if (np.isnan(accumulated)): #first\n",
+        "            accumulated = value\n",
+        "        else:\n",
+        "           accumulated -= value #subtract value \n",
+        "        df.at[index,'Change'] =  accumulated\n",
+        "      else:\n",
+        "        df.at[index,'Change'] = float(\"NaN\")  # if there is only one bond score, then 'Change' is NaN"
+      ],
+      "execution_count": 181,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "dtRUs_bPWy_X"
+      },
+      "source": [
+        "df[\"Change\"] = -df[\"Change\"] # swap the sign of last column to read more intuitively; negative indicates bond decreased, positive indicates that it increased\n",
+        "pivot_survey = pivot_survey.reset_index().rename({'index':'UserId'}, axis = 'columns')\n",
+        "newcolumn = pivot_survey[\"userid\"]\n",
+        "newdf = df.assign(UserId = newcolumn)\n",
+        "newdf = newdf.set_index('UserId')"
+      ],
+      "execution_count": 10,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "nPCXbRZWkl0D",
+        "colab": {
+          "base_uri": "https://localhost:8080/",
+          "height": 235
+        },
+        "outputId": "4d568634-ea13-4581-ceaf-df710a246e66"
+      },
+      "source": [
+        "newdf.head(5)"
+      ],
+      "execution_count": 257,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "text/html": [
+              "<div>\n",
+              "<style scoped>\n",
+              "    .dataframe tbody tr th:only-of-type {\n",
+              "        vertical-align: middle;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe tbody tr th {\n",
+              "        vertical-align: top;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe thead th {\n",
+              "        text-align: right;\n",
+              "    }\n",
+              "</style>\n",
+              "<table border=\"1\" class=\"dataframe\">\n",
+              "  <thead>\n",
+              "    <tr style=\"text-align: right;\">\n",
+              "      <th>tenureDay</th>\n",
+              "      <th>4</th>\n",
+              "      <th>5</th>\n",
+              "      <th>6</th>\n",
+              "      <th>14</th>\n",
+              "      <th>15</th>\n",
+              "      <th>16</th>\n",
+              "      <th>Change</th>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>UserId</th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "    </tr>\n",
+              "  </thead>\n",
+              "  <tbody>\n",
+              "    <tr>\n",
+              "      <th>+/wAfc2I0c831C21wvh2Kcr4DZk=</th>\n",
+              "      <td>4.25</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>4.0</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>-0.25</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0NdvBGRsXuoa20PHou4K3FMlBA=</th>\n",
+              "      <td>NaN</td>\n",
+              "      <td>3.75</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0eFEPPuFJm9U5lXwlAKw/I+Clo=</th>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>3.75</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0pfU/ormz318pPBTZ6cWtrgHkI=</th>\n",
+              "      <td>NaN</td>\n",
+              "      <td>5.00</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>5.0</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>-0.00</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+11s2fkg+oFKje/WvOYnzxbYgtY=</th>\n",
+              "      <td>4.50</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "      <td>NaN</td>\n",
+              "    </tr>\n",
+              "  </tbody>\n",
+              "</table>\n",
+              "</div>"
+            ],
+            "text/plain": [
+              "tenureDay                        4     5     6   14   15  16  Change\n",
+              "UserId                                                              \n",
+              "+/wAfc2I0c831C21wvh2Kcr4DZk=  4.25   NaN   NaN  4.0  NaN NaN   -0.25\n",
+              "+0NdvBGRsXuoa20PHou4K3FMlBA=   NaN  3.75   NaN  NaN  NaN NaN     NaN\n",
+              "+0eFEPPuFJm9U5lXwlAKw/I+Clo=   NaN   NaN  3.75  NaN  NaN NaN     NaN\n",
+              "+0pfU/ormz318pPBTZ6cWtrgHkI=   NaN  5.00   NaN  NaN  5.0 NaN   -0.00\n",
+              "+11s2fkg+oFKje/WvOYnzxbYgtY=  4.50   NaN   NaN  NaN  NaN NaN     NaN"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 257
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "kLp-tekCxJ4d"
+      },
+      "source": [
+        "The distribution of bond score 'change' across participants who logged two scores:"
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/",
+          "height": 295
+        },
+        "id": "mhLK_U7ftw7E",
+        "outputId": "f6b7856f-4a88-43a4-c0c7-da6937dbc032"
+      },
+      "source": [
+        "sns.histplot(df[\"Change\"], color='red', alpha =0.5).set(title=\"Change metric distribution\")\n",
+        "plt.show()"
+      ],
+      "execution_count": 252,
+      "outputs": [
+        {
+          "output_type": "display_data",
+          "data": {
+            "image/png": "iVBORw0KGgoAAAANSUhEUgAAAYUAAAEWCAYAAACJ0YulAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4yLjIsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy+WH4yJAAAazklEQVR4nO3de5QdZZ3u8e9DuCnoIKZPG4EYQPAMgwpMgxfILBREYFTEpVHiKHiLjDBHD44OiApnvM4oKMcLrCAMogRBgZHx4AgqSHQADTFCuKiAZJIYmgQQERBJeM4fVV1U2r3TO929d3Wnn89ae3XV+1bV/lUnXc+u65ZtIiIiADZruoCIiJg4EgoREVFJKERERCWhEBERlYRCRERUEgoREVFJKMSoSTpV0tebrmMikvQHSbuMw3Is6bnl8FmSPjL26kDSzLLGaeX4NZLeOR7LLpf3XUlHj9fyoncSCrFBkuZKWlRuQFaVf+wHNF1XUzrdeNre1vZd4/neto+1/bGRppN0t6SDR1jWf5c1rhtrXa0+HNg+zPZXx7rs6L2EQrQl6QTg88AngX5gJvBl4Igm65rIJG3edA0jmQw1RoNs55XXn72AvwD+ALxhA9OcClwMnA88BNwCDNT6TwTuLPtuBY6s9R0D/Bj4LPAA8BvgsFr/zsC15bzfB74EfL3W/2Lgv4DfAb8ADtxAnXcDHwBuAh4GzqEIue/Wlv+MkZYNfAJYB/yx/N18sWw3cBzwa+A3tbbnlsNPAU4DlgEPluv9lDa1fgBYBfwWePuw5ZwHfLwcng58p6zxfmAhxYe8rwFPAI+WNX4QmFUu5x3Af5e/16G2zcvlXQN8Cvgp8Hvg28D2Zd+BwIoWv9ODgUOBPwGPl+/3i9ry3lkObwZ8uFz/eyn+v/xF2TdUx9FlbWuAk5v+/z+VX40XkNfEfJV/7GuHNhptpjm13EAeDkwrNyrX1/rfADy73Ci8sdwgzyj7jik3JO8q5/37ckOosv86isDYEjig3FB9vezbAbivfN/NgFeU431t6rwbuJ4iCHYoN0yLgb2BrYEfAqd0suz6xq62fANXAdtTbuxZf2P+pXK+Hcp1fSmwVZvf+SCwJ7ANsID2ofAp4Cxgi/I1u/a7uxs4uLbcoQ3v+eVyn0LrUFhZe+9Lar/vA2kTCrX/B18f1l/9nijC7Q5gF2Bb4FLga8NqO7us64XAY8BfNv03MFVfOXwU7TwTWGN77QjT/dj2FS6OTX+N4o8aANvftP1b20/Yvojik/R+tXmX2T67nPerwAygX9JMYF/go7b/ZPvHwOW1+f4OuKJ83ydsXwUsotiQt/MF24O2V1J8qr7B9s9t/xG4jCIgRrtsgE/Zvt/2o/VGSZtRbBTfa3ul7XW2/8v2Yy2WMQf4N9tLbT9MsbFt53GK39dzbD9ue6HtkR5kdqrth4fXWPO12nt/BJgzdCJ6jN4MnG77Ltt/AE4C3jTsMNb/sf2o7V9Q7J29sNWCovsSCtHOfcD0Do4/31MbfgTYemgeSW+VtETS7yT9juJT6PRW89p+pBzclmLv4v5aG8Dy2vBzgDcMLbdc9gEUG8l2BmvDj7YY33YMyx5eX910ir2RO0eYH4r1ri9n2Qam/QzFp+8rJd0l6cQOlt+uxlb9yyj2QKa3mXZjPJv112UZsDnFntuQ4f+PtiUakVCIdq6j2I1/7WhmlvQcikMCxwPPtL0dsBRQB7OvAraX9NRa20614eUUn2q3q722sf3p0dQ6zEjLbvdpvF37GopDbLt28N6rWH89Z7ab0PZDtt9vexfgNcAJkg4aZY1Dhr/34xT1PwxU/xbl3kPfRiz3txRhW1/2WtYP5pggEgrRku0HgY8CX5L0WklPlbSFpMMk/WsHi9iGYmOxGkDS2yj2FDp572UUh2xOlbSlpJcAr65N8nXg1ZJeKWmapK0lHShpx41YxXZGWvYgxbHxjth+AjgXOF3Ss8tlvkTSVi0mvxg4RtIeZSCe0m65kl4l6bmSRHHyeh3FCeaNrrHm72rv/c/At8pDe7+i2AP8W0lbUJw0rtc/CMwqD5W1ciHwvyXtLGlbiqvZLurg0GQ0IKEQbdk+DTiBYiOwmuJT9PHAv3cw760UV9xcR7HReD7wk414+zcDL6E4jPVx4CKKPRdsL6e4LPZDtbo+wDj8f+5g2WcAr5f0gKT/2+Fi/xG4GfgZxZVC/9KqVtvfpbgE+IcUh4Z+uIFl7kZx1dQfKH7HX7Z9ddn3KeDD5eGvf+ywRijOCZ1HcShna+B/lXU9CLwH+ArFyeiHgRW1+b5Z/rxP0uIWyz23XPa1FFeZ/RH4h42oK3po6GqFiAlN0kXA7bbbfnqOiLHLnkJMSJL2lbSrpM0kHUrx6X3EPZSIGJvc2RgT1bMormd/JsWhir+3/fNmS4rY9HXt8JGknShulumnOOE43/YZkranOD48i+IGmDm2HyhPmJ1BcT34I8Axtlsdn4yIiC7p5uGjtcD7be9B8diA4yTtQfHogx/Y3g34QTkOcBjFybPdgHnAmV2sLSIiWuja4SPbqyiuu8b2Q5Juo7jN/wiK2+ahuIv1GuCfyvbzy7syr5e0naQZ5XJamj59umfNmtWtVYiI2CTdeOONa2z3terryTkFSbMoHiNwA9Bf29Dfw5N3Ne7A+ndUrijb1gsFSfMo9iSYOXMmixYt6lrdERGbIklt75bv+tVH5c0qlwDvs/37el+5V7BRJzVsz7c9YHugr69l0EVExCh1NRTKux8vAS6wfWnZPChpRtk/g+KJlVDcFFO/zX7Hsi0iInqka6FQXk10DnCb7dNrXZdTPDud8ue3a+1vVeHFwIMbOp8QERHjr5vnFPYH3gLcLGlJ2fYh4NPAxZLeQfG0xDll3xUUl6PeQXFJ6tu6WFtERLTQzauPfkz7J2IeNLyhPL9wXLfqiYiIkeUxFxERUUkoREREJaEQERGVhEJERFTylNSICeqQ2bNZM9j+Gyun9/dz5cKFPawopoKEQsQEtWZwkMVz57bt32fBgh5WE1NFDh9FREQloRAREZWEQkREVBIKERFRSShEREQloRAREZWEQkREVBIKERFRSShEREQloRAREZWEQkREVBIKERFR6VooSDpX0r2SltbaLpK0pHzdPfTdzZJmSXq01ndWt+qKiIj2uvmU1POALwLnDzXYfuPQsKTTgAdr099pe68u1hMRESPoWijYvlbSrFZ9kgTMAV7erfePiIiN19Q5hdnAoO1f19p2lvRzST+SNLvdjJLmSVokadHq1au7X2lExBTSVCgcBVxYG18FzLS9N3ACsEDS01vNaHu+7QHbA319fT0oNSJi6uh5KEjaHHgdcNFQm+3HbN9XDt8I3Ans3uvaIiKmuib2FA4Gbre9YqhBUp+kaeXwLsBuwF0N1BYRMaV185LUC4HrgOdJWiHpHWXXm1j/0BHA3wA3lZeofgs41vb93aotIiJa6+bVR0e1aT+mRdslwCXdqiUiIjqTO5ojIqKSUIiIiEpCISIiKgmFiIioJBQiIqKSUIiIiEpCISIiKgmFiIioJBQiIqKSUIiIiEpCISIiKgmFiIioJBQiIqKSUIiIiEpCISIiKgmFiIioJBQiIqKSUIiIiEo3v6P5XEn3SlpaaztV0kpJS8rX4bW+kyTdIemXkl7ZrboiIqK9bu4pnAcc2qL9c7b3Kl9XAEjaA3gT8FflPF+WNK2LtUVERAtdCwXb1wL3dzj5EcA3bD9m+zfAHcB+3aotIiJaa+KcwvGSbioPLz2jbNsBWF6bZkXZ9mckzZO0SNKi1atXd7vWiIgppdehcCawK7AXsAo4bWMXYHu+7QHbA319feNdX0TElLZ5L9/M9uDQsKSzge+UoyuBnWqT7li2RUxah8yezZrBwbb90/v7uXLhwh5WFDGynoaCpBm2V5WjRwJDVyZdDiyQdDrwbGA34Ke9rC1ivK0ZHGTx3Llt+/dZsKCH1UR0pmuhIOlC4EBguqQVwCnAgZL2AgzcDbwbwPYtki4GbgXWAsfZXtet2iIiorWuhYLto1o0n7OB6T8BfKJb9URExMhyR3NERFQSChERUUkoREREJaEQERGVhEJERFQSChERUUkoREREJaEQERGVhEJERFQSChERUUkoREREJaEQERGVhEJERFQSChERUUkoREREJaEQERGVhEJERFQSChERUelaKEg6V9K9kpbW2j4j6XZJN0m6TNJ2ZfssSY9KWlK+zupWXRER0V439xTOAw4d1nYVsKftFwC/Ak6q9d1pe6/ydWwX64qIiDa6Fgq2rwXuH9Z2pe215ej1wI7dev+IiNh4TZ5TeDvw3dr4zpJ+LulHkma3m0nSPEmLJC1avXp196uMiJhCGgkFSScDa4ELyqZVwEzbewMnAAskPb3VvLbn2x6wPdDX19ebgiMipoieh4KkY4BXAW+2bQDbj9m+rxy+EbgT2L3XtUVETHU9DQVJhwIfBF5j+5Fae5+kaeXwLsBuwF29rC0iImDzbi1Y0oXAgcB0SSuAUyiuNtoKuEoSwPXllUZ/A/yzpMeBJ4Bjbd/fcsEREdE1XQsF20e1aD6nzbSXAJd0q5aIqeiQ2bNZMzjYtn96fz9XLlzYw4piMuhaKEREs9YMDrJ47ty2/fssWNDDamKyyGMuIiKiklCIiIhKQiEiIioJhYiIqCQUIiKiklCIiIhKQiEiIioJhYiIqHQUCpL276QtIiImt073FL7QYVtERExiG3zMhaSXAC8F+iSdUOt6OjCtm4VFRETvjfTsoy2BbcvpnlZr/z3w+m4VFRERzdhgKNj+EfAjSefZXtajmiIioiGdPiV1K0nzgVn1eWy/vBtFRUREMzoNhW8CZwFfAdZ1r5yIiGhSp6Gw1vaZXa0kIiIa1+klqf8h6T2SZkjafujV1coiIqLnOt1TOLr8+YFam4FdNjSTpHOBVwH32t6zbNseuIji/MTdwBzbD6j40uYzgMOBR4BjbC/usL6Inhvp6y5XLl/ew2oixkdHoWB751Eu/zzgi8D5tbYTgR/Y/rSkE8vxfwIOA3YrXy8Czix/RkxII33d5fRPfrKH1USMj45CQdJbW7XbPr9Ve63/WkmzhjUfARxYDn8VuIYiFI4Azrdt4HpJ20maYXtVJzVGRMTYdXr4aN/a8NbAQcBi1t8D6FR/bUN/D9BfDu8A1Pe3V5Rt64WCpHnAPICZM2eO4u0jIqKdTg8f/UN9XNJ2wDfG+ua2LckbOc98YD7AwMDARs0bEREbNtpHZz8MjPY8w6CkGQDlz3vL9pXATrXpdizbIiKiRzo9p/AfFFcbQfEgvL8ELh7le15OcTXTp8uf3661Hy/pGxQnmB/M+YSIiN7q9JzCZ2vDa4FltleMNJOkCylOKk+XtAI4hSIMLpb0DmAZMKec/AqKy1HvoLgk9W0d1hYREeOk03MKP5LUz5MnnH/d4XxHtek6qMW0Bo7rZLkREdEdnX7z2hzgp8AbKD7Z3yApj86OiNjEdHr46GRgX9v3AkjqA74PfKtbhUVERO91evXRZkOBULpvI+aNiIhJotM9hf+U9D3gwnL8jRQnhiMiYhMy0nc0P5fiDuQPSHodcEDZdR1wQbeLi4iI3hppT+HzwEkAti8FLgWQ9Pyy79VdrS4iInpqpPMC/bZvHt5Yts3qSkUREdGYkUJhuw30PWU8C4mIiOaNFAqLJL1reKOkdwI3dqekiIhoykjnFN4HXCbpzTwZAgPAlsCR3SwsIiJ6b4OhYHsQeKmklwF7ls3/z/YPu15ZRET0XKfPProauLrLtURERMNyV3JERFQSChERUUkoREREJaEQERGVhEJERFQSChERUen00dnjRtLzgItqTbsAH6V4pMa7gNVl+4ds5/HcERE91PNQsP1LYC8ASdOAlcBlwNuAz9n+bK9rioiIQtOHjw4C7rS9rOE6IiKC5kPhTTz5bW4Ax0u6SdK5kp7RagZJ8yQtkrRo9erVrSaJiIhRaiwUJG0JvAb4Ztl0JrArxaGlVcBpreazPd/2gO2Bvr6+ntQaETFVNLmncBiwuHzoHrYHba+z/QRwNrBfg7VFRExJPT/RXHMUtUNHkmbYXlWOHgksbaSqiCli+fLl7LP77m37p/f3c+XChT2sKCaCRkJB0jbAK4B315r/VdJegIG7h/VFxDjzunUsnju3bf8+Cxb0sJqYKBoJBdsPA88c1vaWJmqJiIgnNX31UURETCBNnlOIaNQhs2ezZnCwbX+OqcdUlFCIKWvN4GCOqUcMk8NHERFRSShEREQloRAREZWEQkREVBIKERFRSShEREQloRAREZWEQkREVHLzWkSMSu4I3zQlFCJiVHJH+KYph48iIqKSUIiIiEpCISIiKgmFiIioJBQiIqLS2NVHku4GHgLWAWttD0jaHrgImEXxPc1zbD/QVI0REVNN03sKL7O9l+2BcvxE4Ae2dwN+UI5HRESPNB0Kwx0BfLUc/irw2gZriYiYcpoMBQNXSrpR0ryyrd/2qnL4HqC/mdIiIqamJu9oPsD2Skn/A7hK0u31TtuW5OEzlQEyD2DmzJm9qTQiYopobE/B9sry573AZcB+wKCkGQDlz3tbzDff9oDtgb6+vl6WHBGxyWskFCRtI+lpQ8PAIcBS4HLg6HKyo4FvN1FfRMRU1dTho37gMklDNSyw/Z+SfgZcLOkdwDJgTkP1xSSQp3RGjL9GQsH2XcALW7TfBxzU+4piMspTOiPG30S7JDUiIhqUUIiIiEpCISIiKgmFiIioJBQiIqKSUIiIiEpCISIiKgmFiIioJBQiIqKSUIiIiEpCISIiKgmFiIioJBQiIqKSUIiIiEpCISIiKgmFiIioJBQiIqKSUIiIiEpCISIiKj0PBUk7Sbpa0q2SbpH03rL9VEkrJS0pX4f3uraIiKlu8wbecy3wftuLJT0NuFHSVWXf52x/toGaIiKCBkLB9ipgVTn8kKTbgB16XUdERPy5JvYUKpJmAXsDNwD7A8dLeiuwiGJv4oEW88wD5gHMnDmzZ7VG7x0yezZrBgfb9q9cvryH1cR4G+nfd3p/P1cuXNjDigIaDAVJ2wKXAO+z/XtJZwIfA1z+PA14+/D5bM8H5gMMDAy4dxVHr60ZHGTx3Llt+6d/8pM9rCbG20j/vvssWNDDamJII1cfSdqCIhAusH0pgO1B2+tsPwGcDezXRG0REVNZE1cfCTgHuM326bX2GbXJjgSW9rq2iIipronDR/sDbwFulrSkbPsQcJSkvSgOH90NvLuB2iIiprQmrj76MaAWXVf0upborpxIjJh8Gr36KDZtOZEYMfnkMRcREVFJKERERCWhEBERlYRCRERUEgoREVFJKERERCWXpEbEhLR8+XL22X33tv25z6U7EgoRMSF53brc59KAHD6KiIhKQiEiIioJhYiIqOScwhSWB9ZFtDdV/z4SClNYHlgXm7KxbtSn6t9HQiHayiWBMZlN1Y36WCUUoq1cEhgx9eREc0REVBIKERFRmXCHjyQdCpwBTAO+YvvTDZc0YU3VqyMiJoJN9ZzbhAoFSdOALwGvAFYAP5N0ue1bm61sYsqJtIjmbKrn3CZUKAD7AXfYvgtA0jeAI4CuhEK3P2mPtPx7Bgd5Vn9/194/Iiavpo4EyPa4L3S0JL0eONT2O8vxtwAvsn18bZp5wLxy9HnAL3tc5nRgTY/fs9uyTpND1mnimyzr8xzbfa06JtqewohszwfmN/X+khbZHmjq/bsh6zQ5ZJ0mvk1hfSba1UcrgZ1q4zuWbRER0QMTLRR+BuwmaWdJWwJvAi5vuKaIiCljQh0+sr1W0vHA9yguST3X9i0NlzVcY4euuijrNDlknSa+Sb8+E+pEc0RENGuiHT6KiIgGJRQiIqKSUBgFSR+TdJOkJZKulPTspmsaC0mfkXR7uU6XSdqu6ZrGStIbJN0i6QlJk/oSQUmHSvqlpDskndh0PWMl6VxJ90pa2nQt40XSTpKulnRr+f/uvU3XNFoJhdH5jO0X2N4L+A7w0aYLGqOrgD1tvwD4FXBSw/WMh6XA64Brmy5kLGqPfjkM2AM4StIezVY1ZucBhzZdxDhbC7zf9h7Ai4HjJuu/U0JhFGz/vja6DTCpz9bbvtL22nL0eor7QyY127fZ7vXd7t1QPfrF9p+AoUe/TFq2rwXub7qO8WR7le3F5fBDwG3ADs1WNToT6pLUyUTSJ4C3Ag8CL2u4nPH0duCipouIyg7A8tr4CuBFDdUSHZA0C9gbuKHZSkYnodCGpO8Dz2rRdbLtb9s+GThZ0knA8cApPS1wI420PuU0J1PsBl/Qy9pGq5N1iuglSdsClwDvG3ZEYdJIKLRh++AOJ70AuIIJHgojrY+kY4BXAQd5kty8shH/RpNZHv0ySUjagiIQLrB9adP1jFbOKYyCpN1qo0cAtzdVy3gov9jog8BrbD/SdD2xnjz6ZRKQJOAc4Dbbpzddz1jkjuZRkHQJxWO7nwCWAcfanrSf3iTdAWwF3Fc2XW/72AZLGjNJRwJfAPqA3wFLbL+y2apGR9LhwOd58tEvn2i4pDGRdCFwIMVjpgeBU2yf02hRYyTpAGAhcDPFdgHgQ7avaK6q0UkoREREJYePIiKiklCIiIhKQiEiIioJhYiIqCQUIiKikpvXIoaR9CyKS0D3pbicdRD4d4r7OF7VZG0R3ZY9hYia8iaky4BrbO9q+68pnhrb32xlEb2RUIhY38uAx22fNdRg+xcUNyZtK+lb5XdPXFAGCJI+KulnkpZKml9rv0bSv0j6qaRfSZpdtj9V0sXls/cvk3TD0Hc+SDpE0nWSFkv6ZvksnYieSShErG9P4MY2fXsD76P4XoNdgP3L9i/a3tf2nsBTKJ4hNWRz2/uV8w09H+s9wAPls/c/Avw1gKTpwIeBg23vAywCThivFYvoREIhonM/tb3C9hPAEmBW2f6y8tP+zcDLgb+qzTP0YLQba9MfQPG9CNheCtxUtr+YInB+ImkJcDTwnO6sSkRrOdEcsb5bgNe36XusNrwO2FzS1sCXgQHbyyWdCmzdYp51jPz3JuAq20dtdNUR4yR7ChHr+yGwlaR5Qw2SXgDMbjP9UACsKY//twuUup8Ac8pl7wE8v2y/Hthf0nPLvm0k7b7xqxAxegmFiJryuySOBA6WdKekW4BPAfe0mf53wNkU3wn9PYpHXY/ky0CfpFuBj1PsnTxoezVwDHChpJuA64D/ObY1itg4eUpqRI9JmgZsYfuPknYFvg88r/wO5ohG5ZxCRO89Fbi6/KYuAe9JIMREkT2FiIio5JxCRERUEgoREVFJKERERCWhEBERlYRCRERU/j9ZHcpv38bZbQAAAABJRU5ErkJggg==\n",
+            "text/plain": [
+              "<Figure size 432x288 with 1 Axes>"
+            ]
+          },
+          "metadata": {
+            "tags": [],
+            "needs_background": "light"
+          }
+        }
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/"
+        },
+        "id": "aeEGEs1_Wy4s",
+        "outputId": "eb661a2c-e190-4cbe-b656-246a4ffd474c"
+      },
+      "source": [
+        "df[\"Change\"].notna().mean()"
+      ],
+      "execution_count": 259,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "text/plain": [
+              "0.21338816541009825"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 259
+        }
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/"
+        },
+        "id": "D7A_IYtyugHR",
+        "outputId": "fb287ea4-edd2-4616-a7e5-83abf524842e"
+      },
+      "source": [
+        "# Number of users with one bond score and no change tracked\n",
+        "len(newdf[newdf['Change'].isna()])"
+      ],
+      "execution_count": 192,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "text/plain": [
+              "3443"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 192
+        }
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/"
+        },
+        "id": "f1TD_lC5ugN6",
+        "outputId": "cef23484-62ac-4bf3-b763-37f89870b01c"
+      },
+      "source": [
+        "# Number of users with two bond scores and where change could be tracked\n",
+        "len(newdf[newdf['Change'].notna()])"
+      ],
+      "execution_count": 193,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "text/plain": [
+              "934"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 193
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "e4YzH6nwW1jy"
+      },
+      "source": [
+        "# Results\n"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "D80qjpZO-KTE"
+      },
+      "source": [
+        "On average, where there are two bond scores submitted by the user, the bond increases by **0.21** between the first and second score.\n",
+        "\n",
+        "It must be noted that in **3443** cases the participant recorded an initial bond score, but no subseqent one. Only in **934** out of the **4377** users recorded two bond scores."
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "ES6GqMvoTEFG"
+      },
+      "source": [
+        "It is worth checking whether there are differences in mean scores between those who submitted only one bond score and those who submitted two.\n",
+        "\n",
+        "Let's look at the distribution of average scores for these two groups, by tenure day:"
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "bI4UJbtNeYLf"
+      },
+      "source": [
+        "OneScore = newdf[newdf['Change'].isna()]"
+      ],
+      "execution_count": 205,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "dtw_79eaWUbg"
+      },
+      "source": [
+        "TwoScores = newdf[newdf['Change'].notna()]"
+      ],
+      "execution_count": 196,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/"
+        },
+        "id": "-hYq2yGgYGG2",
+        "outputId": "a00ec1c7-84c1-438b-a71a-875fe45d1e31"
+      },
+      "source": [
+        "print(\"Mean bond scores for users who submitted one score:\")\n",
+        "print(OneScore[[4, 5, 6, 14, 15, 16, 'Change']].mean())\n",
+        "print(\"Mean bond scores for users who submitted two scores:\")\n",
+        "print(TwoScores[[4, 5, 6, 14, 15, 16, 'Change']].mean())"
+      ],
+      "execution_count": 198,
+      "outputs": [
+        {
+          "output_type": "stream",
+          "text": [
+            "Mean bond scores for users who submitted one score:\n",
+            "tenureDay\n",
+            "4         3.780131\n",
+            "5         3.756394\n",
+            "6         3.742317\n",
+            "14             NaN\n",
+            "15        4.312500\n",
+            "16             NaN\n",
+            "Change         NaN\n",
+            "dtype: float64\n",
+            "Mean bond scores for users who submitted two scores:\n",
+            "tenureDay\n",
+            "4         3.920115\n",
+            "5         3.924390\n",
+            "6         3.817416\n",
+            "14        4.037109\n",
+            "15        4.044296\n",
+            "16        3.925725\n",
+            "Change    0.111617\n",
+            "dtype: float64\n"
+          ],
+          "name": "stdout"
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "eyLQWa2kIIxE"
+      },
+      "source": [
+        "The partcipants who submitted two scores at the two timepoints, on average had slightly higher early bond scores at timepoint one, compared to those who didn't.\n",
+        "\n",
+        "There are 4 instances of outlier participants who submitted their only bond score on day 15, but did not submit an early one on days 4,5 or 6.\n",
+        "\n",
+        "Whilst the sample sizes are different, willingness to submit a second score may suggest a level of engagement."
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "U2lAx_XKb_u-"
+      },
+      "source": [
+        "# Task 2 - Is Bond dependent on engagement / activity?"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "A7frHyEMvqHP"
+      },
+      "source": [
+        "To attempt to answer this question I will implement the following steps:\n",
+        "\n",
+        "\n",
+        "1.   Pivot the user_activity data to reorganise with the tenure day as columns. Fill the Nan cells with 0s for ease of analysis.\n",
+        "2.   Add a column to the pivotted table with the mean number of user messages for the 28 day period for each user.\n",
+        "3.   Develop a visual to understand the trend in average user engagement over 28 days.\n",
+        "4.   Test the correlation between early bond score (days 4-6) and messages sent days 0-6 to see if there is a relationship between user message volumes and bond scores.\n",
+        "5.   Test the correlation between change in bond scores and messages sent days 0-28 for a relationship between message volumes and the changes that occured in bond scores.\n",
+        "6.   Statistical test to gauge if there is a difference in engagement levels (messages sent) between users who reorded low bond scores and high bond scores.\n",
+        "\n"
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/",
+          "height": 204
+        },
+        "id": "YiCK17wnfLKA",
+        "outputId": "0bf0dafb-1df4-4dfd-d2e5-e146c89a07cc"
+      },
+      "source": [
+        "user_activty.head(5)"
+      ],
+      "execution_count": 221,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "text/html": [
+              "<div>\n",
+              "<style scoped>\n",
+              "    .dataframe tbody tr th:only-of-type {\n",
+              "        vertical-align: middle;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe tbody tr th {\n",
+              "        vertical-align: top;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe thead th {\n",
+              "        text-align: right;\n",
+              "    }\n",
+              "</style>\n",
+              "<table border=\"1\" class=\"dataframe\">\n",
+              "  <thead>\n",
+              "    <tr style=\"text-align: right;\">\n",
+              "      <th></th>\n",
+              "      <th>userid</th>\n",
+              "      <th>tenureDay</th>\n",
+              "      <th>userMessages</th>\n",
+              "      <th>moodCategory</th>\n",
+              "    </tr>\n",
+              "  </thead>\n",
+              "  <tbody>\n",
+              "    <tr>\n",
+              "      <th>0</th>\n",
+              "      <td>rLzw2UmRCEe46MtW5gES+bx5uRU=</td>\n",
+              "      <td>0</td>\n",
+              "      <td>45</td>\n",
+              "      <td>neutral</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>1</th>\n",
+              "      <td>V0EzPowhWQCxtw1Xtxv2l9RrJ0k=</td>\n",
+              "      <td>0</td>\n",
+              "      <td>70</td>\n",
+              "      <td>NaN</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>2</th>\n",
+              "      <td>bNQ0Y1NqoS4K4jwNTOQlR1dJHlQ=</td>\n",
+              "      <td>0</td>\n",
+              "      <td>83</td>\n",
+              "      <td>NaN</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>3</th>\n",
+              "      <td>6nO/an2GbB8cg/dDVm0qzc5kfag=</td>\n",
+              "      <td>0</td>\n",
+              "      <td>61</td>\n",
+              "      <td>NaN</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>4</th>\n",
+              "      <td>JM3fV1nBKwLHxhduyB8Are4RTAQ=</td>\n",
+              "      <td>0</td>\n",
+              "      <td>93</td>\n",
+              "      <td>negative</td>\n",
+              "    </tr>\n",
+              "  </tbody>\n",
+              "</table>\n",
+              "</div>"
+            ],
+            "text/plain": [
+              "                         userid  tenureDay  userMessages moodCategory\n",
+              "0  rLzw2UmRCEe46MtW5gES+bx5uRU=          0            45      neutral\n",
+              "1  V0EzPowhWQCxtw1Xtxv2l9RrJ0k=          0            70          NaN\n",
+              "2  bNQ0Y1NqoS4K4jwNTOQlR1dJHlQ=          0            83          NaN\n",
+              "3  6nO/an2GbB8cg/dDVm0qzc5kfag=          0            61          NaN\n",
+              "4  JM3fV1nBKwLHxhduyB8Are4RTAQ=          0            93     negative"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 221
+        }
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "iVz0pnt8fo0y"
+      },
+      "source": [
+        "pivot_activity = user_activty.pivot_table('userMessages', index =\"userid\", columns =\"tenureDay\") "
+      ],
+      "execution_count": 115,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "3emqEyyt5nxO"
+      },
+      "source": [
+        "pivot_activity = pivot_activity.fillna(0)"
+      ],
+      "execution_count": 116,
+      "outputs": []
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "O_Yid5iMPDcH"
+      },
+      "source": [
+        "We can observe below the 28 tenure days and the volume of messages each user sent each day of their tenure (if any)."
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/",
+          "height": 235
+        },
+        "id": "8ce4e5aoD8SZ",
+        "outputId": "cf324f54-3694-4359-8ff7-0c0e06614291"
+      },
+      "source": [
+        "pivot_activity.head(5)"
+      ],
+      "execution_count": 117,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "text/html": [
+              "<div>\n",
+              "<style scoped>\n",
+              "    .dataframe tbody tr th:only-of-type {\n",
+              "        vertical-align: middle;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe tbody tr th {\n",
+              "        vertical-align: top;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe thead th {\n",
+              "        text-align: right;\n",
+              "    }\n",
+              "</style>\n",
+              "<table border=\"1\" class=\"dataframe\">\n",
+              "  <thead>\n",
+              "    <tr style=\"text-align: right;\">\n",
+              "      <th>tenureDay</th>\n",
+              "      <th>0</th>\n",
+              "      <th>1</th>\n",
+              "      <th>2</th>\n",
+              "      <th>3</th>\n",
+              "      <th>4</th>\n",
+              "      <th>5</th>\n",
+              "      <th>6</th>\n",
+              "      <th>7</th>\n",
+              "      <th>8</th>\n",
+              "      <th>9</th>\n",
+              "      <th>10</th>\n",
+              "      <th>11</th>\n",
+              "      <th>12</th>\n",
+              "      <th>13</th>\n",
+              "      <th>14</th>\n",
+              "      <th>15</th>\n",
+              "      <th>16</th>\n",
+              "      <th>17</th>\n",
+              "      <th>18</th>\n",
+              "      <th>19</th>\n",
+              "      <th>20</th>\n",
+              "      <th>21</th>\n",
+              "      <th>22</th>\n",
+              "      <th>23</th>\n",
+              "      <th>24</th>\n",
+              "      <th>25</th>\n",
+              "      <th>26</th>\n",
+              "      <th>27</th>\n",
+              "      <th>28</th>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>userid</th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "    </tr>\n",
+              "  </thead>\n",
+              "  <tbody>\n",
+              "    <tr>\n",
+              "      <th>+/wAfc2I0c831C21wvh2Kcr4DZk=</th>\n",
+              "      <td>33.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>30.0</td>\n",
+              "      <td>24.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>29.0</td>\n",
+              "      <td>37.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>19.0</td>\n",
+              "      <td>22.0</td>\n",
+              "      <td>46.0</td>\n",
+              "      <td>23.0</td>\n",
+              "      <td>106.0</td>\n",
+              "      <td>23.0</td>\n",
+              "      <td>19.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>15.0</td>\n",
+              "      <td>19.0</td>\n",
+              "      <td>54.0</td>\n",
+              "      <td>33.0</td>\n",
+              "      <td>14.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>33.0</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0NdvBGRsXuoa20PHou4K3FMlBA=</th>\n",
+              "      <td>54.0</td>\n",
+              "      <td>30.0</td>\n",
+              "      <td>22.0</td>\n",
+              "      <td>7.0</td>\n",
+              "      <td>7.0</td>\n",
+              "      <td>58.0</td>\n",
+              "      <td>5.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>22.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0eFEPPuFJm9U5lXwlAKw/I+Clo=</th>\n",
+              "      <td>51.0</td>\n",
+              "      <td>150.0</td>\n",
+              "      <td>126.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>63.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>86.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0pfU/ormz318pPBTZ6cWtrgHkI=</th>\n",
+              "      <td>103.0</td>\n",
+              "      <td>74.0</td>\n",
+              "      <td>11.0</td>\n",
+              "      <td>37.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>64.0</td>\n",
+              "      <td>67.0</td>\n",
+              "      <td>19.0</td>\n",
+              "      <td>51.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>50.0</td>\n",
+              "      <td>22.0</td>\n",
+              "      <td>57.0</td>\n",
+              "      <td>47.0</td>\n",
+              "      <td>9.0</td>\n",
+              "      <td>43.0</td>\n",
+              "      <td>15.0</td>\n",
+              "      <td>18.0</td>\n",
+              "      <td>23.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>40.0</td>\n",
+              "      <td>2.0</td>\n",
+              "      <td>26.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>9.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>56.0</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+11s2fkg+oFKje/WvOYnzxbYgtY=</th>\n",
+              "      <td>65.0</td>\n",
+              "      <td>32.0</td>\n",
+              "      <td>11.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>48.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>2.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>8.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "    </tr>\n",
+              "  </tbody>\n",
+              "</table>\n",
+              "</div>"
+            ],
+            "text/plain": [
+              "tenureDay                        0      1      2     3   ...    25   26    27    28\n",
+              "userid                                                   ...                       \n",
+              "+/wAfc2I0c831C21wvh2Kcr4DZk=   33.0    0.0    0.0  30.0  ...  25.0  0.0  25.0  33.0\n",
+              "+0NdvBGRsXuoa20PHou4K3FMlBA=   54.0   30.0   22.0   7.0  ...   0.0  0.0   0.0   0.0\n",
+              "+0eFEPPuFJm9U5lXwlAKw/I+Clo=   51.0  150.0  126.0   0.0  ...   0.0  0.0   0.0   0.0\n",
+              "+0pfU/ormz318pPBTZ6cWtrgHkI=  103.0   74.0   11.0  37.0  ...   0.0  9.0   0.0  56.0\n",
+              "+11s2fkg+oFKje/WvOYnzxbYgtY=   65.0   32.0   11.0   0.0  ...   0.0  0.0   0.0   0.0\n",
+              "\n",
+              "[5 rows x 29 columns]"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 117
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "SxtVDVE_rOhf"
+      },
+      "source": [
+        "Next, we can add a column with the mean number of daily messages for each user for the period:"
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "3JNkfz7ZMKHm"
+      },
+      "source": [
+        "pivot_averages = pivot_activity.append(pivot_activity.mean(numeric_only=True), ignore_index=True)"
+      ],
+      "execution_count": 118,
+      "outputs": []
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "foBPqhJ8raQ9"
+      },
+      "source": [
+        "We can see in the visual below that the average number of messages sent per user drops significantly after the first day, from 80.5 messages per user on tenure day 0, to 43.5 messages per user on tenure day 1. This decrease continues throughout the period, but tails off."
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "HSy-bKGrMRqE"
+      },
+      "source": [
+        "plotdfavg = pivot_averages.iloc[-1]"
+      ],
+      "execution_count": 119,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "STBQ4PONRG5r"
+      },
+      "source": [
+        "plotdfavg.reset_index\n",
+        "plotdfavg = pd.DataFrame(plotdfavg)\n",
+        "plotdfavg[\"Tenure_Days\"] = plotdfavg.index\n",
+        "plotdfavg.rename(columns={4377: 'Average_Messages'}, inplace=True)\n",
+        "plotdfavg.head()"
+      ],
+      "execution_count": 123,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/",
+          "height": 385
+        },
+        "id": "M7sz40--Muj7",
+        "outputId": "9a54785c-413f-42ac-9308-1b0291e5a972"
+      },
+      "source": [
+        "sns.displot(plotdfavg, x = plotdfavg[\"Tenure_Days\"], y=plotdfavg[\"Average_Messages\"], bins = 29, color='blue', alpha = .5, legend=False).set(title='Average Messages Received by Tenure day')\n",
+        "plt.show()"
+      ],
+      "execution_count": 125,
+      "outputs": [
+        {
+          "output_type": "display_data",
+          "data": {
+            "image/png": "iVBORw0KGgoAAAANSUhEUgAAAWAAAAFwCAYAAACGt6HXAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4yLjIsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy+WH4yJAAAgAElEQVR4nO3deZhcZZn+8e9Nwg5C0CYGwiaijDBstijjhkYURQ06GEGWiCjyGxeYxQEcFRxxBkYRZ8YRCYIEZIugEFFZjAg6MyJNCFvAIUIEYpYOEgk7hOf3x/sWKdteTid9+q2qvj/X1VedOkud59SpvuvUezZFBGZmNvrWKV2AmdlY5QA2MyvEAWxmVogD2MysEAewmVkhDmAzs0IcwGYjQNKhkq6t4XX3lfTQIMND0stHer7tRtL2+b0YX7qW4XAAN5H0c0mPSFq/dC1rS9LJ+QN5bJ/+x+b+JxcqrXaSPixplaTHJD0q6TZJ765znhFxYUS8vc551EXSZ/N79Zikp5reu8ck3VW6vk7mAM4kbQ+8EQjgvTW8folv5v8DjujTb3ru3+n+NyI2ATYHvglcImnzwjW1pIj4l4jYJL9fx5Dfu/y3y2jU0G5briPFAbzaEcCvgPNIIYWk9SWtkLRrYyRJXZKelLRlfv5uSfPyeP8jabemcRdKOl7S7cDjksZLOkHSbyWtlDRf0vuaxh8n6XRJyyXdL+mTzT+rJG0m6RxJiyUtknSKpHGDLNPNwEaSdsnT7wJskPu/YIhlOD7Pa6Wk30iakvvvLaknb2EulfS1pmm+J2mJpD9KurEx/zzsxZJ+mKe7OS/DL5uG7yzpOkl/yPOb1jTsXfk9W5lr+odB1ygQEc8DFwAbAzvl11lf0lclPZBr/5akDZvmMzW/H4/mdbX/UO9/3ur+Ze4+U9JX+7zHV0r6u9y9laTLJfXm9fzppvE2lHRe/iU2H3jNUMsIvEvSfflz8xVJ60haL7+Hf9n02ltKekJSV4XXbEwz2Po4T9J/SfpRXic3SdoxD/uzJgGlX5gfbXq//lvSGZIeBk4ear30qWtcHne5pPuAA/oMP1LS3bmu+yR9vGnYnZLe0/R83fw6e1Z9X0ZMRPgvnY69APgb4NXAs8DE3P9c4MtN430CuDp37wksA14LjCMF90Jg/Tx8ITAP2AbYMPf7ALAV6cvvg8DjwKQ87BhgPjAZmAD8lLRFPj4P/wFwFilMtgR+DXx8gOU5Gfgu8FngtNzv34ATc/+Th1oG4JXAg8BWedztgR1z9/8Ch+fuTYDXNc37I8Cm+TW+DsxrGnZJ/tsIeFV+/V/mYRvn50cC43Nty4FX5eGLgTfm7gnAXgMs+4ebXnNcXmfPAFvmfmcAs4Etcp0/BP41D9sb+COwX15HWwM7D/X+95nnm/JyqKnWJ5vW+y3AF4D1gJcB9wHvyOOeCvwi17YNcCfw0CCf2wCuz+NvS/p189E87JuNdZ+fHwv8cIj/g+blGGp9nAc8nN+z8cCFwCVNn5UXPru538+bavsw8BzwqTzthoOtl37qPAa4J79HW+T3oPl/5QBgR0DAm4EnGp8X4B+BS5teaypwR5HcKRV4rfQHvIEUui/Jz+8B/jZ3vw34bdO4/w0ckbvPBL7U57V+A7w5dy8EPjLEvOcBU3P3z2gK1DzvyB/QicDT5CDPww8Brh/gdU8mBe22wAPAuvlxG/40gAdcBuDlpHB+G7Bun3FuBL7YeM8GWb7N8zJsRgrDZ4FXNg0/hdX/8B8EftFn+rOAk3L3A8DHgRcNMc/GP/eKPL8ngWl5mEhfejs2jb8PcH/T/M7o5zUHff/50+BSrvVN+fnHgJ/l7tcCD/R57ROB7+Tu+4D9m4YdzdAB3Dz+3wBzmufF6i+Cnsb7MMR7V3V9nAd8u2nYu4B7cvf2DB3ADzQNG3S99FPnz4Bjmp6/ve/8+ox/BXBs7t4KWNn4HAGXAf842PtS15+bIJLpwLURsTw/vyj3g/TNupGk1yq1E+9B2hIC2A74+/zTfYWkFaSA26rptR9snpGkI5p+7q8AdgVekgdv1Wf85u7tSCG6uGnas0hbYgOKiAdIW/f/AtwbEQ/2GWXAZYiIBcBxpDBfJukSSY1lOwp4BXBPbkp4d16+cZJOzT/dHyV9CZGXsYv0ZTLYMr62Ty2HAi/Nw/+a9E/+O0k3SNpnkEX/VURsTtr6nE1q3yfXsBFwS9M8rs79ycv+235er/L7H+m/+hJSQAN8iLR12Hidrfos42dJAQ9//hn43SDL2NB3/K1yHTeRtvz2lbQz6Qt1doXXaxhqfQAsaep+gvRrqKrmuodaL30N+j5JeqekX+WmkxWkz81LACLi96QNqb9W2i/wTlavn1E1Jhu+m+U2pmnAOEmND9P6wOaSdo+I2yTNIv0zLQWuioiVebwHSc0TXx5kFi9cbk7SdsDZwBTSjo5VkuaRvv0h/cSe3DTtNk3dD5K2wF4SEc8NczHPJzWlHNnPsEGXISIuAi6S9CJS4JxGanq4FzhE0jrA+4HLJL04d08lbTUvJG35PpKXsZe0ZTqZ1TsC+y7jDRGx3wC13AxMlbQu8ElgVp/p+5vmMUn/D7hP0rnAbaQt4l0iYtEA78eOA/Qfzvt/MXCtpFNJW6KNtv4HSVt1Ow0w3WLSMjWOPti2wrz6jv/7pmEzgcNIQXlZRDxV4fUaBl0fQ3g8P24EPJq7X9pnnOZLMS5n8PXSV+N9anjhfVI6iuly0n6dKyPiWUlXsPr/DNL78lFSBv5vxXmOOG8Bw4HAKlJ75B757y9I7XCNIwguIv0cOzR3N5wNHJO3jiVpY0kHSNp0gHltTPrQ9ULaUUDaAm6YBRwraev8zXx8Y0BELAauBU6X9KK8o2VHSW+usIyXkn6izepn2IDLIOmVkt6aP9BPkf5Bns+1HyapK9JOrhX5tZ4ntd09TWob3Ii05d1YhlXA90k7XDbKW2XNR2lcBbxC0uF5x8i6kl4j6S+UdiodKmmziHiW9E/9fIVlJyL+AHwb+EKu92zgDK3ekbq1pHfk0c8BjpQ0Jb/HW0vaebjvf0TcSgqVbwPXRETjPfo1sFJp5+aG+RfDrpIaO9tmASdKmiBpMqmNdCifyeNvQ2rnvbRp2HdJ4X8Y6Yt4OAZcH0NNGBG9wCLgsLyMH6H/L7bG+EOtl75mAZ+WNFnSBOCEpmHrkTaieoHnJL2T9PlvdgWwF+n9Gu77MmIcwKmp4TsR8UBELGn8Ad8ADpU0Pv+Ue5z0s+cnjQkjoofUvvcN0lbeAlLbVr8iYj5wOmkH1lLgL0k/hRrOJv2T3w7cCvyYtMW4Kg8/gvThmp/ndxkwaagFjIgnI+KnEfFkP8MGW4b1STuFlpO2oLYktVcC7A/cJekx4N+Bg/Prn0/6Obgo1/mrPrP8JGmreAnp6ISLSYFN/mXxduBg0lbcEtIWd+O47MOBhblp4xjSF2JVXycdLbAb6YttAfCr/Fo/Je1wJCJ+TfqlcAZpZ9wNpJ/iMPz3/yLSL4EXvrTzl9C7SV/097M6pDfLo3yR9P7dT/osXFBh2a4k7dibB/yI9CXSmN+DwFzSF/8vKrzWCyqsj6F8DPgM6ct4F+B/hhh/wPXSj7OBa0i/aOaSvtib6/40KaQfITUB/UnTS/6sXg7s0DztaGs0zlsLyt/c34qI7YYcuU1JOg14aURMH3JkWyO56eX3EfG50rW0EklfAF4REYeVqmHMtwG3ktwe/RbSls9E4CRW7/DrCLnZYT3gDtIxrkeR2uKsBko7jt9POoTMMklbkD57h5esw00QrUWkn6CPkJog7iYdL9pJNiX95Huc1FZ5OukntI0wSV8iHUf8lYi4v3Q9rULSx0g7GH8SETcWrcVNEGZmZXgL2MyskLZpA95///3j6quvLl2GmdmaUH8922YLePny5UOPZGbWRtomgM3MOo0D2MysEAewmVkhDmAzs0IcwGZmhTiAzcwKcQCbmRXiADYzK8QBbGZWiAPYzKwQB7CZWSG1B7Ckv5V0l6Q7JV0saQNJO0i6SdICSZdKWq/uOszMWk2tV0OTtDXp3kyviogn892FDybdIvqMiLhE0rdIV6Y/c6Tnf8EFt1Ue9/DDdx/p2ZuZDWo0miDGAxtKGk+6S+5i4K2kGxpCuj30gaNQh5lZS6k1gCNiEfBV4AFS8P6RdPfWFRHxXB7tIWDr/qaXdLSkHkk9vb29dZZqZjbqag1gSROAqaRbP28FbEy6nXklETEjIrojorurq6umKs3Myqi7CeJtwP0R0RsRz5Juxvh6YPPcJAEwGVhUcx1mZi2n7gB+AHidpI0kCZgCzAeuBw7K40zHd8U1szGo7jbgm0g72+YCd+T5zQCOB/5O0gLgxcA5ddZhZtaKar8pZ0ScBJzUp/d9wN51z9vMrJX5TDgzs0IcwGZmhdTeBFGSz24zs1bmLWAzs0IcwGZmhTiAzcwKcQCbmRXiADYzK8QBbGZWiAPYzKwQB7CZWSEOYDOzQhzAZmaFOIDNzApxAJuZFeIANjMrxAFsZlaIA9jMrBAHsJlZIQ5gM7NCHMBmZoU4gM3MCnEAm5kV4gA2MyvEAWxmVogD2MysEAewmVkhDmAzs0IcwGZmhdQawJJeKWle09+jko6TtIWk6yTdmx8n1FmHmVkrqjWAI+I3EbFHROwBvBp4AvgBcAIwJyJ2Aubk52ZmY8poNkFMAX4bEb8DpgIzc/+ZwIGjWIeZWUsYzQA+GLg4d0+MiMW5ewkwsb8JJB0tqUdST29v72jUaGY2akYlgCWtB7wX+F7fYRERQPQ3XUTMiIjuiOju6uqquUozs9E1WlvA7wTmRsTS/HyppEkA+XHZKNVhZtYyRiuAD2F18wPAbGB67p4OXDlKdZiZtYzaA1jSxsB+wPebep8K7CfpXuBt+bmZ2Zgyvu4ZRMTjwIv79HuYdFSEmdmY5TPhzMwKcQCbmRXiADYzK8QBbGZWiAPYzKwQB7CZWSEOYDOzQhzAZmaFOIDNzApxAJuZFeIANjMrxAFsZlaIA9jMrBAHsJlZIQ5gM7NCHMBmZoU4gM3MCnEAm5kV4gA2MyvEAWxmVogD2MysEAewmVkhDmAzs0IcwGZmhTiAzcwKcQCbmRXiADYzK8QBbGZWiAPYzKyQ2gNY0uaSLpN0j6S7Je0jaQtJ10m6Nz9OqLsOM7NWMxpbwP8OXB0ROwO7A3cDJwBzImInYE5+bmY2ptQawJI2A94EnAMQEc9ExApgKjAzjzYTOLDOOszMWlHdW8A7AL3AdyTdKunbkjYGJkbE4jzOEmBifxNLOlpSj6Se3t7emks1MxtddQfweGAv4MyI2BN4nD7NDRERQPQ3cUTMiIjuiOju6uqquVQzs9FVdwA/BDwUETfl55eRAnmppEkA+XFZzXWYmbWcWgM4IpYAD0p6Ze41BZgPzAam537TgSvrrMPMrBWNH4V5fAq4UNJ6wH3AkaTgnyXpKOB3wLRRqMPMrKXUHsARMQ/o7mfQlLrnbWbWynwmnJlZIQ5gM7NCHMBmZoU4gM3MCnEAm5kV4gA2MyvEAWxmVogD2MysEAewmVkhDmAzs0IcwGZmhVQKYEmvzxdSR9Jhkr4mabt6SzMz62xVt4DPBJ6QtDvw98BvgfNrq8rMbAyoGsDP5TtXTAW+ERH/BWxaX1lmZp2v6uUoV0o6ETgceKOkdYB16yvLzKzzVd0C/iDwNPCRfJeLycBXaqvKzGwMqBTAOXQvB9bPvZYDP6irKDOzsaDqURAfI91Q86zca2vgirqKMjMbC6o2QXwCeD3wKEBE3AtsWVdRZmZjQdUAfjoinmk8kTQeiHpKMjMbG6oG8A2SPgtsKGk/4HvAD+sry8ys81UN4BOAXuAO4OPAj4HP1VWUmdlYUOk44Ih4Hjg7/5mZ2QioFMCS7uDP23z/CPQAp0TEwyNdmJlZp6t6JtxPgFXARfn5wcBGwBLgPOA9I16ZmVmHqxrAb4uIvZqe3yFpbkTsJemwOgozM+t0VXfCjZO0d+OJpNcA4/LT50a8KjOzMaDqFvBHgXMlbQKIdELGR/M1gv+1ruLMzDpZ1aMgbgb+UtJm+fkfmwbPGmxaSQuBlaQ25OciolvSFsClwPbAQmBaRDwy3OLNzNpZ1S1gJB0A7AJsIAmAiPjnipO/JSKWNz0/AZgTEadKOiE/P75qLWZmnaDqxXi+Rbok5adITRAfANbmlkRTgZm5eyZw4Fq8lplZW6q6E+6vIuII4JGI+CKwD/CKitMGcK2kWyQdnftNjIjFuXsJMLFyxWZmHaJqE8ST+fEJSVsBDwOTKk77hohYJGlL4DpJ9zQPjIiQ1O+FfXJgHw2w7bbbVpydmVl7qLoFfJWkzUl3wZhL2nF2cZUJI2JRflxGuoj73sBSSZMA8uOyAaadERHdEdHd1dVVsVQzs/ZQ9Y4YX4qIFRFxOantd+eI+PxQ00naWNKmjW7g7cCdwGxgeh5tOnDlmhRvZtbOqu6E+0AjSIHPAN+RtGeFSScCv5R0G/Br4EcRcTVwKrCfpHuBt+XnZmZjStU24M9HxPckvYEUmF8BvgW8drCJIuI+YPd++j8MTBlmrWZmHaVqG/Cq/HgAMCMifgSsV09JZmZjQ9UAXiTpLNKxwD+WtP4wpjUzs35UDdFpwDXAOyJiBbAFqS3YzMzWUNU24EmkHWhPS9oX2A04v7aqzMzGgKpbwJcDqyS9HJgBbMPqi7ObmdkaqBrAz0fEc8D7gf+MiM9Q/Uw4MzPrR9UAflbSIcARwFW537r1lGRmNjZUDeAjSRfg+XJE3C9pB+CC+soyM+t8VS/IPl/S8cC2+fn9wGl1FmZm1umqnor8HmAecHV+voek2XUWZmbW6ao2QZxMuorZCoCImAe8rKaazMzGhMo74frcBw7g+ZEuxsxsLKl6IsZdkj5Euj39TsCngf+prywzs85XNYA/BfwT8DTpQuzXAF+qq6jRdsEFt1Ua7/DD/+zCbmZma6zqURBPkAL4n+otx8xs7Bg0gIc60iEi3juy5ZiZjR1DbQHvAzxIana4iXRLejMzGwFDBfBLgf2AQ4APAT8CLo6Iu+ouzMys0w16GFpErIqIqyNiOvA6YAHwc0mfHJXqzMw62JA74fLdLw4gbQVvD/wH6fbyZma2FobaCXc+sCvwY+CLEXHnqFRlZjYGDLUFfBjwOHAs8GnphX1wAiIiXlRjbWZmHW3QAI6IqhfrmRARj4xMSWZmY8NI3dl4zgi9jpnZmFH1VOShtPXxwT7F2MxKGKkt4Bih1zEzGzNGKoDNzGyYRiqA27oJwsyshMoBLOkNko7M3V35xpwNU0a8MjOzDlf1MLOTgOOBE3OvdYHvNoZHxB+GmH6cpFslXZWf7yDpJkkLJF0qab01K9/MrH1V3QJ+H/Be0kkZRMTvgU2HMZ9jgbubnp8GnBERLwceAY4axmuZmXWEqgH8TEQE+WgHSRtXnYGkyaRrSXw7PxfwVuCyPMpM4MCqr2dm1imqBvAsSWcBm0v6GPBT4OyK034d+EdW38TzxcCKiHguP38I2Lq/CSUdLalHUk9vb2/F2ZmZtYdKARwRXyVtsV4OvBL4QkT851DTSXo3sCwiblmT4iJiRkR0R0R3V1fXmryEmVnLqnwmXERcB1w3zNd/PfBeSe8CNgBeBPw7aUt6fN4KngwsGubrmpm1vapHQayU9Gifvwcl/UDSywaaLiJOjIjJEbE9cDDws4g4FLgeOCiPNh24ci2Xw8ys7VTdAv46qa32ItJJFwcDOwJzgXOBfYc53+OBSySdAtwKnDPM6c3M2p7SwQ1DjCTdFhG79+k3LyL26G9YHbq7u6Onp6fu2ZiZ1aHfs4WrHgXxhKRpktbJf9OAp/IwX4jHzGwNVA3gQ4HDgWXA0tx9mKQNAd+g08xsDVRqA46I+4D3DDD4lyNXjpnZ2FEpgCVtQDpdeBfS4WQARMRHaqrLzKzjVT0K4gLgHuAdwD+TmiTuHnSKDnPBBbdVHneoO2xUfa3bb1/KbrtNXOv5mVlrqtoG/PKI+DzweETMJF3b4bX1lWVm1vmqBvCz+XGFpF2BzYAt6ynJzGxsqNoEMUPSBOBzwGxgE+DztVVlZjYGDBnAktYBHo2IR4AbgQFPPTYzs+qGbIKIiOdJl5M0M7MRVLUN+KeS/kHSNpK2aPzVWpmZWYer2gb8wfz4iaZ+gZsjzMzWWNUz4XYYeiwzMxuOqtcD3kjS5yTNyM93yne7MDOzNVS1Dfg7wDPAX+Xni4BTaqnIzGyMqHo94J6I6JZ0a0TsmfuNynWAG3w9YDNrY2t1PeBn8qUnG7el3xF4eoQKMzMbk6oeBXEycDWwjaQLSTfb/HBNNZmZjQlVj4K4VtItwOtIm9LHRsTyWiszM+twVa8H/EPSDTlnR8Tj9ZZkZjY2VG0D/irwRmC+pMskHZQv0m5mZmuoahPEDcANksYBbwU+Rrod/YtqrM3MrKNV3QlHPgriPaTTkvcCzqupJjOzMaFqG/AsYG/SkRDfAFax+voQ1qTq7YZ8GyEzq9oGfA4wDVhJOivui4yxe8KZmY20QbeAJb0COCT/LQcuJZ0995ZRqM3MrKMN1QRxD/AL4N0RsQBA0t/WXpWZ2RgwVBPE+4HFwPWSzpY0hQHOaTYzs+EZNIAj4oqIOBjYGbgeOA7YUtKZkt4+GgWamXWqSjvhIuLxiLgoIt4DTAZuBY4fajpJG0j6taTbJN0l6Yu5/w6SbpK0QNKlktZbq6UwM2tDVY+CeEFEPBIRMyJiSoXRnwbemi9buQewv6TXAacBZ0TEy4FHgKOGW4eZWbsbdgAPRySP5afr5r8gnU13We4/EziwzjrMzFpRrQEMIGmcpHnAMuA64LfAioh4Lo/yELD1ANMeLalHUk9vb2/dpZqZjaraAzgiVkXEHqS2471JO/SqTjsjIrojorurq6u2Gs3MSqh8LYi1FRErJF0P7ANsLml83gqeTLrHXEfwKcZmVlWtW8CSuiRtnrs3BPYjncJ8PXBQHm06cGWddZiZtaK6t4AnATPzZSzXAWZFxFWS5gOXSDqFdEjbOTXXYWbWcmoN4Ii4Hdizn/73kdqDzczGrNp3wpmZWf8cwGZmhTiAzcwKcQCbmRXiADYzK2TUTsSwelS9Bx34JBGzVuMtYDOzQhzAZmaFOIDNzApxAJuZFeIANjMrxAFsZlaIA9jMrBAHsJlZIQ5gM7NCfCZcm/PZbWbty1vAZmaFOIDNzApxAJuZFeIANjMrxAFsZlaIA9jMrBAHsJlZIQ5gM7NCfCLGGFH11kU+scNs9HgL2MysEAewmVkhDmAzs0IcwGZmhdQawJK2kXS9pPmS7pJ0bO6/haTrJN2bHyfUWYeZWSuqewv4OeDvI+JVwOuAT0h6FXACMCcidgLm5OdmZmNKrQEcEYsjYm7uXgncDWwNTAVm5tFmAgfWWYeZWSsatTZgSdsDewI3ARMjYnEetASYOMA0R0vqkdTT29s7KnWamY2WUTkRQ9ImwOXAcRHxqKQXhkVESIr+pouIGcAMgO7u7n7HsZFz++1LK52wcfvtS9ltt36/M/+ET+owG1ztASxpXVL4XhgR38+9l0qaFBGLJU0CltVdx1hXJQyrni1nZiOj7qMgBJwD3B0RX2saNBuYnrunA1fWWYeZWSuqewv49cDhwB2S5uV+nwVOBWZJOgr4HTCt5jrMzFpOrQEcEb8ENMDgKXXO28ys1flMODOzQhzAZmaFOIDNzApxAJuZFeIANjMrxLckslqUOKtuJOfns/1sNDiA7QUjGSY+q85saG6CMDMrxAFsZlaIA9jMrBAHsJlZIQ5gM7NCHMBmZoU4gM3MCnEAm5kV4hMxrOWN9Fl1I6VqXeAz5qx/DmCrRYmz6nbbbeKoBp3P9rO15SYIM7NCHMBmZoU4gM3MCnEAm5kV4gA2MyvEAWxmVogD2MysEB8HbFazkTyRZCRvqTScE1d8Ikk9HMDW8lr1n79qXT5hwwbiJggzs0IcwGZmhdQawJLOlbRM0p1N/baQdJ2ke/PjhDprMDNrVXVvAZ8H7N+n3wnAnIjYCZiTn5uZjTm1BnBE3Aj8oU/vqcDM3D0TOLDOGszMWlWJNuCJEbE4dy8BRu8CrmZmLaToTriICCAGGi7paEk9knp6e3tHsTIzs/qVCOClkiYB5MdlA40YETMiojsiuru6ukatQDOz0VDiRIzZwHTg1Px4ZYEazKyiKmfylThDb7RfC0b+pKBaA1jSxcC+wEskPQScRAreWZKOAn4HTKuzBrPSWvVMvqp8Jl99ag3giDhkgEFT6pyvmVk78JlwZmaFOIDNzApxAJuZFeIANjMrxAFsZlaIA9jMrBAHsJlZIb4lkZkNqt1PJGll3gI2MyvEAWxmVogD2MysEAewmVkhDmAzs0IcwGZmhTiAzcwKcQCbmRXiADYzK8QBbGZWiAPYzKwQB7CZWSEOYDOzQhQRpWuoRFIv6Tb2w/USYPkIlzPavAytoxOWw8sw+pZHxP59e7ZNAK8pST0R0V26jrXhZWgdnbAcXobW4SYIM7NCHMBmZoWMhQCeUbqAEeBlaB2dsBxehhbR8W3AZmataixsAZuZtSQHsJlZIR0bwJL2l/QbSQsknVC6njUhaaGkOyTNk9RTup6qJJ0raZmkO5v6bSHpOkn35scJJWscygDLcLKkRXl9zJP0rpI1DkXSNpKulzRf0l2Sjs39221dDLQcbbU++tORbcCSxgH/B+wHPATcDBwSEfOLFjZMkhYC3RHRTgecI+lNwGPA+RGxa+73b8AfIuLU/IU4ISKOL1nnYAZYhpOBxyLiqyVrq0rSJGBSRMyVtClwC3Ag8GHaa10MtBzTaKP10Z9O3QLeG1gQEfdFxDPAJcDUwjWNGRFxI/CHPr2nAjNz90zSP1DLGmAZ2kpELI6Iubl7JXA3sDXtty4GWo6216kBvDXwYNPzh2jPFRbAtZJukXR06WLW0sSIWJy7lwATSxazFj4p6fbcRNHSP92bSdoe2BO4iTZeF32WA9p0fTR0agB3ijdExF7AO4FP5J/FbS9Su1c7tn2dCewI7AEsBk4vW041kjYBLgeOi4hHm4e107roZznacn0069QAXvnqPg8AAAPmSURBVARs0/R8cu7XViJiUX5cBvyA1LTSrpbmtrxGm96ywvUMW0QsjYhVEfE8cDZtsD4krUsKrQsj4vu5d9uti/6Wox3XR1+dGsA3AztJ2kHSesDBwOzCNQ2LpI3zDgckbQy8Hbhz8Kla2mxgeu6eDlxZsJY10git7H20+PqQJOAc4O6I+FrToLZaFwMtR7utj/505FEQAPmQlK8D44BzI+LLhUsaFkkvI231AowHLmqXZZB0MbAv6ZKBS4GTgCuAWcC2pMuKTouIlt3JNcAy7Ev6uRvAQuDjTW2pLUfSG4BfAHcAz+fenyW1n7bTuhhoOQ6hjdZHfzo2gM3MWl2nNkGYmbU8B7CZWSEOYDOzQhzAZmaFOIDNzApxAJuZFTK+dAFmAJJeDMzJT18KrAJ68/O980WVishXpVuZn44Dvg+cEhFPlarJOoOPA7aWU/dlHyWNi4hVwxh/IfmyoPl6BDOAZyNi+uBTmg3OTRDWsiS9WtIN+Wpw1zRdv+Dnkk6T9GtJ/yfpjbn/hyV9o2n6qyTtm7sfk3S6pNuAfSQdlqefJ+msfA3pIUXEY8AxwIH5wuabSJojaW6+eP7UPL9/lnRcUy1flnSspEmSbszzvbNRu41NDmBrVQL+EzgoIl4NnAs0n4o9PiL2Bo4jnSY8lI2BmyJid+Bh4IPA6yNiD1Jzx6FVC8tX4rof2Al4CnhfvmrdW4DT87ULzgWOAJC0Dul6JN8FPgRck+e7OzCv6nyt87gN2FrV+sCuwHUpzxhHuuRgQ+PKXrcA21d4vVWkq2kBTAFeDdycX3tDhn9FMDU9/ku+VOjzpOtOT4yIhZIelrQn6Xq7t0bEw5JuBs7NV/e6IiIcwGOYA9halYC7ImKfAYY/nR9Xsfpz/Bx/+qtug6bup5rafQXMjIgT16iwdJW67Um3vToU6AJeHRHP5vbixny/Tbr9z0tJW8RExI05rA8AzpP0tYg4f03qsPbnJghrVU8DXZL2gXQ9WEm7DDHNQmAPSetI2oaBrw87BzhI0pb5tbeQtF2VovJOuG+Stl4fATYDluXwfQvQ/Do/APYHXgNck6ffDlgaEWeTAnqvKvO1zuQtYGtVzwMHAf8haTPSZ/XrwF2DTPPfpLbZ+aT7hs3tb6SImC/pc6TbPa0DPAt8gnRpxoFcn9t21yEF65dy/wuBH0q6A+gB7mmazzOSrgdWNG197wt8RtKzpJt+HjHIPK3D+TA0s5rkcJ8LfCAi7i1dj7UeN0GY1UDSq4AFwByHrw3EW8BmmaSbSEdfNDs8Iu4oUY91PgewmVkhboIwMyvEAWxmVogD2MysEAewmVkh/x9C5vt7AYscZgAAAABJRU5ErkJggg==\n",
+            "text/plain": [
+              "<Figure size 360x360 with 1 Axes>"
+            ]
+          },
+          "metadata": {
+            "tags": [],
+            "needs_background": "light"
+          }
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "jLrBKO5PT3zm"
+      },
+      "source": [
+        "Most messages occur in the earliest tenure days.\n",
+        "\n",
+        "This aligns with what was seen in the distribution graph for bond score-counts, a much higher volume of bond scores were submitted in the earlier tenure days.\n"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "dhiLZVdHrsZu"
+      },
+      "source": [
+        "## Test 1.  Engagement and Bond score in the first 6 days"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "TNlouw_Trzfa"
+      },
+      "source": [
+        "The aim in this section is to examine whether there is a correlation between bond score assigned at timepoint one in the first 6 days, and the volume of messages sent by the user in that period."
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/",
+          "height": 235
+        },
+        "id": "UmV62muduL_F",
+        "outputId": "9717ad7f-c8b7-4443-eba3-56e84d50e2dd"
+      },
+      "source": [
+        "early_engagement = pd.DataFrame(pivot_activity, columns=[0,1,2,3,4,5,6])\n",
+        "early_engagement = early_engagement.fillna(0)\n",
+        "early_engagement[\"total_messages\"] = early_engagement.iloc[:, 0:7].sum(axis=1)\n",
+        "early_engagement.head(5)"
+      ],
+      "execution_count": 208,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "text/html": [
+              "<div>\n",
+              "<style scoped>\n",
+              "    .dataframe tbody tr th:only-of-type {\n",
+              "        vertical-align: middle;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe tbody tr th {\n",
+              "        vertical-align: top;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe thead th {\n",
+              "        text-align: right;\n",
+              "    }\n",
+              "</style>\n",
+              "<table border=\"1\" class=\"dataframe\">\n",
+              "  <thead>\n",
+              "    <tr style=\"text-align: right;\">\n",
+              "      <th></th>\n",
+              "      <th>0</th>\n",
+              "      <th>1</th>\n",
+              "      <th>2</th>\n",
+              "      <th>3</th>\n",
+              "      <th>4</th>\n",
+              "      <th>5</th>\n",
+              "      <th>6</th>\n",
+              "      <th>total_messages</th>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>userid</th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "    </tr>\n",
+              "  </thead>\n",
+              "  <tbody>\n",
+              "    <tr>\n",
+              "      <th>+/wAfc2I0c831C21wvh2Kcr4DZk=</th>\n",
+              "      <td>33.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>30.0</td>\n",
+              "      <td>24.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>29.0</td>\n",
+              "      <td>116.0</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0NdvBGRsXuoa20PHou4K3FMlBA=</th>\n",
+              "      <td>54.0</td>\n",
+              "      <td>30.0</td>\n",
+              "      <td>22.0</td>\n",
+              "      <td>7.0</td>\n",
+              "      <td>7.0</td>\n",
+              "      <td>58.0</td>\n",
+              "      <td>5.0</td>\n",
+              "      <td>183.0</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0eFEPPuFJm9U5lXwlAKw/I+Clo=</th>\n",
+              "      <td>51.0</td>\n",
+              "      <td>150.0</td>\n",
+              "      <td>126.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>63.0</td>\n",
+              "      <td>390.0</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0pfU/ormz318pPBTZ6cWtrgHkI=</th>\n",
+              "      <td>103.0</td>\n",
+              "      <td>74.0</td>\n",
+              "      <td>11.0</td>\n",
+              "      <td>37.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>64.0</td>\n",
+              "      <td>67.0</td>\n",
+              "      <td>356.0</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+11s2fkg+oFKje/WvOYnzxbYgtY=</th>\n",
+              "      <td>65.0</td>\n",
+              "      <td>32.0</td>\n",
+              "      <td>11.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>48.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>2.0</td>\n",
+              "      <td>158.0</td>\n",
+              "    </tr>\n",
+              "  </tbody>\n",
+              "</table>\n",
+              "</div>"
+            ],
+            "text/plain": [
+              "                                  0      1      2  ...     5     6  total_messages\n",
+              "userid                                             ...                            \n",
+              "+/wAfc2I0c831C21wvh2Kcr4DZk=   33.0    0.0    0.0  ...   0.0  29.0           116.0\n",
+              "+0NdvBGRsXuoa20PHou4K3FMlBA=   54.0   30.0   22.0  ...  58.0   5.0           183.0\n",
+              "+0eFEPPuFJm9U5lXwlAKw/I+Clo=   51.0  150.0  126.0  ...   0.0  63.0           390.0\n",
+              "+0pfU/ormz318pPBTZ6cWtrgHkI=  103.0   74.0   11.0  ...  64.0  67.0           356.0\n",
+              "+11s2fkg+oFKje/WvOYnzxbYgtY=   65.0   32.0   11.0  ...   0.0   2.0           158.0\n",
+              "\n",
+              "[5 rows x 8 columns]"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 208
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "Q49eTtX4tQjZ"
+      },
+      "source": [
+        "We can take the bond scores from the survey_repsonses dataset. These can be joined to the activity data using the 'userid' index."
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "qdOL5oKSwDqM"
+      },
+      "source": [
+        "earlyBondScores = newdf[[4,5,6]]"
+      ],
+      "execution_count": 209,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "yXUQEZCsxU51"
+      },
+      "source": [
+        "earlyBondScores = earlyBondScores.fillna(0)"
+      ],
+      "execution_count": 210,
+      "outputs": []
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "2G5MSt4ste-t"
+      },
+      "source": [
+        "Only one of these fields have data in them, so they can be added together to get the first bondscore for each userid"
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "v87HIskBymkV"
+      },
+      "source": [
+        "earlyBondScores[\"early_bond\"] = earlyBondScores[4] + earlyBondScores[5] + earlyBondScores[6]\n",
+        "del earlyBondScores[4], earlyBondScores[5], earlyBondScores[6]"
+      ],
+      "execution_count": 211,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "mqgPyAioy4pv"
+      },
+      "source": [
+        "earlyEngagmentReduced = early_engagement[\"total_messages\"]\n",
+        "earlyEngagmentReduced = pd.DataFrame(earlyEngagmentReduced)"
+      ],
+      "execution_count": 212,
+      "outputs": []
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "qS36eFRE2wHE"
+      },
+      "source": [
+        "The following merged dataframe will be used for correlation analysis."
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "dFIS_5zuvYVg"
+      },
+      "source": [
+        "# DF for correlation\n",
+        "bondAndEngagement = earlyBondScores.join(earlyEngagmentReduced)"
+      ],
+      "execution_count": 213,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/",
+          "height": 235
+        },
+        "id": "hBsQfhp8xdDP",
+        "outputId": "7d45c2ee-456c-48ef-da54-b4216457f40f"
+      },
+      "source": [
+        "bondAndEngagement.head()"
+      ],
+      "execution_count": 214,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "text/html": [
+              "<div>\n",
+              "<style scoped>\n",
+              "    .dataframe tbody tr th:only-of-type {\n",
+              "        vertical-align: middle;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe tbody tr th {\n",
+              "        vertical-align: top;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe thead th {\n",
+              "        text-align: right;\n",
+              "    }\n",
+              "</style>\n",
+              "<table border=\"1\" class=\"dataframe\">\n",
+              "  <thead>\n",
+              "    <tr style=\"text-align: right;\">\n",
+              "      <th></th>\n",
+              "      <th>early_bond</th>\n",
+              "      <th>total_messages</th>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>UserId</th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "    </tr>\n",
+              "  </thead>\n",
+              "  <tbody>\n",
+              "    <tr>\n",
+              "      <th>+/wAfc2I0c831C21wvh2Kcr4DZk=</th>\n",
+              "      <td>4.25</td>\n",
+              "      <td>116.0</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0NdvBGRsXuoa20PHou4K3FMlBA=</th>\n",
+              "      <td>3.75</td>\n",
+              "      <td>183.0</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0eFEPPuFJm9U5lXwlAKw/I+Clo=</th>\n",
+              "      <td>3.75</td>\n",
+              "      <td>390.0</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0pfU/ormz318pPBTZ6cWtrgHkI=</th>\n",
+              "      <td>5.00</td>\n",
+              "      <td>356.0</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+11s2fkg+oFKje/WvOYnzxbYgtY=</th>\n",
+              "      <td>4.50</td>\n",
+              "      <td>158.0</td>\n",
+              "    </tr>\n",
+              "  </tbody>\n",
+              "</table>\n",
+              "</div>"
+            ],
+            "text/plain": [
+              "                              early_bond  total_messages\n",
+              "UserId                                                  \n",
+              "+/wAfc2I0c831C21wvh2Kcr4DZk=        4.25           116.0\n",
+              "+0NdvBGRsXuoa20PHou4K3FMlBA=        3.75           183.0\n",
+              "+0eFEPPuFJm9U5lXwlAKw/I+Clo=        3.75           390.0\n",
+              "+0pfU/ormz318pPBTZ6cWtrgHkI=        5.00           356.0\n",
+              "+11s2fkg+oFKje/WvOYnzxbYgtY=        4.50           158.0"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 214
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "Gsb7TPOI22O4"
+      },
+      "source": [
+        "## Result 1. Pearsons r correlation analysis - Early bond score and user messages"
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/"
+        },
+        "id": "LZi81e3ozYbu",
+        "outputId": "2facab25-1cc6-4706-d0ed-8fcd8d7f9a4e"
+      },
+      "source": [
+        "corr, _ = pearsonr(bondAndEngagement['early_bond'], bondAndEngagement['total_messages'])\n",
+        "print('Pearsons correlation: %.3f' % corr)"
+      ],
+      "execution_count": 260,
+      "outputs": [
+        {
+          "output_type": "stream",
+          "text": [
+            "Pearsons correlation: -0.022\n"
+          ],
+          "name": "stdout"
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "fdBi8bW0laKp"
+      },
+      "source": [
+        "The Pearsons r score of -0.022 shows that there is no correlation between early bond score and total messages sent per user in the first 6 days.\n",
+        "\n",
+        "This indicates, based on those samples selected, that there is no relationship between levels of user engagement and the bond that the user has with the bot."
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "SPL5dC7UTDS4"
+      },
+      "source": [
+        "## Test 2. Participants who recorded two bond scores\n"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "UcFcIDzv3cK9"
+      },
+      "source": [
+        "Next, selecting the subset of 934 users who submitted two bond scores, we can examine whether there is any correlation between their engagement, as gauged by:\n",
+        "\n",
+        "\n",
+        "1.   Total volume of messages sent over the 28 day period\n",
+        "\n",
+        "\n",
+        "This figure is tested against the change metric in the bond\n",
+        "score; the difference between bond score at timepoints one and two."
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "8_iv20jTTNWG"
+      },
+      "source": [
+        "changeMetric = TwoScores[\"Change\"]"
+      ],
+      "execution_count": 217,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "ZTPOuoM4U8oJ"
+      },
+      "source": [
+        "pivot_activity = pivot_activity.fillna(0)"
+      ],
+      "execution_count": 218,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "KSrnogiLTZ3s"
+      },
+      "source": [
+        "activityAndChange = pivot_activity.join(changeMetric)"
+      ],
+      "execution_count": 219,
+      "outputs": []
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "PUCTDznJt5T2"
+      },
+      "source": [
+        "Create a reduced dataframe to measure any correlation between the change in bond score and the total messages sent"
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "Q-uRjgIqJGpL"
+      },
+      "source": [
+        "activityAndChange = activityAndChange[activityAndChange['Change'].notna()]"
+      ],
+      "execution_count": 221,
+      "outputs": []
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "eQNCE6or5Lqf"
+      },
+      "source": [
+        "Add Total messages and Average Messages fields"
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "Etpir_BaYEzO"
+      },
+      "source": [
+        "activityAndChange['Total_Messages_per_user']= activityAndChange.iloc[:, 1:-2].sum(axis=1)\n"
+      ],
+      "execution_count": 225,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "HF8h5IoaZh7A"
+      },
+      "source": [
+        "activityAndChange['Average_Messages_per_user'] = activityAndChange.iloc[:, 1:-3].mean(axis=1)"
+      ],
+      "execution_count": 226,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/",
+          "height": 385
+        },
+        "id": "9Ycpe_SeJvpZ",
+        "outputId": "341f1d84-2764-45b5-990c-872f43254c5c"
+      },
+      "source": [
+        "sns.displot(activityAndChange[\"Average_Messages_per_user\"], color='orange').set(title=\"Distribution - Average Daily Messages per two-score user\")\n",
+        "plt.show()"
+      ],
+      "execution_count": 266,
+      "outputs": [
+        {
+          "output_type": "display_data",
+          "data": {
+            "image/png": "iVBORw0KGgoAAAANSUhEUgAAAXYAAAFwCAYAAACsB1B4AAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4yLjIsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy+WH4yJAAAgAElEQVR4nO3debgcZZn+8e9NEtYAIRAZErYgiCziwEQWl8jiwiqZEVkMEBVFHRdUlNVR/OkgjDsuOAjIjqwCggNiWAIqS0BkRyKQhISQAxgERCHy/P543zZFp885fZJzenlzf67rXKeW7qqnqqvurn67ukoRgZmZlWO5dhdgZmaDy8FuZlYYB7uZWWEc7GZmhXGwm5kVxsFuZlaYtga7pB9L+q9Bmtb6kp6XNCz33yDpw4Mx7Ty9/5M0ZbCmZ0tH0tskPVTpf0zSO9pZk1mnGLJgzzvai5Kek7RA0m8lfUzSP+cZER+LiK82Oa0+d9qImBURIyPiH4NQ+3GSzqmb/m4RcebSTnspatpRUkg6sl01DKa8LC/kN+OnJU2VtF+zz4+ImyJi00Go47hcy2F1ww/Lw49b2nksqxrtR9YaQ33EvldErApsAJwAHAmcNtgzkTR8sKfZgaYAzwAHD8XE27QO3xgRI4FNgTOAH0j6chvq+COLr9cpebg1oeR9sFOXrc+6ImJI/oDHgHfUDdsWeAXYMvefAXwtd68FXAksIAXYTaQ3nrPzc14EngeOADYEAjgEmAVMqwwbnqd3A/B14DbgL8DlwOg8bkfg8Ub1ArsCLwEv5/n9oTK9D+fu5YAvAjOB+cBZwOp5XK2OKbm2p4Bjl3JdrgI8B+yfa5uQhx8JXFz32O8BJ+Xu1UlvpE8Ac4CvAcPyuA8AvwG+Azydx70WuC73PwWcC4yqTHsb4Pe5louAC2qvXx6/J3BXfg1/C2zVxzIFsHHdsH2AvwFr5v4PAg/k+T0CfLTy2Fe9hpXX71+Av9amUam7BxjRoI7jgHPyfLbIw7YA7s/Dj2tm+fJrMSfX+hCwS2Wbn07aBp8Evl15zkXAPOBZ0ja8RWXcmsAv8vNuz6/PzZXxrweuJe0rDwH7Vsbtnut/Ltf0+V5eg9o28INcw4O1updk+6mb9mL7EbATcE/lMdcCt1f6bwIm5e7NSPvcAuA+4D19bEvKdczP6+seFmXMSsC3SPvqs8DNwEp53HvytBfkeW1Wtz0dCdwN/B0YDmyfX/cFeXl2bHb7pomsy+PGApeQttdHgU/XbasXk7bLv5DzqOH8lyZw+gmjx6gL9jx8FvDxBgv7deDHwIj89zZAjabFovA8ixR6K9E42OcAW+bHXAKc0ygU6ueRV+A5deNvYFGwfwiYAWwEjAQuBc6uq+0nua435g1js4Guw8q8DyLtXMNIO/v38/ANSCG2au4flh+3fe7/OfC/eflfQ3qT+2hlx1wIfIq00a4EbAy8E1gBGEMKm+/mxy9P2jkOy6/Pf5B23NrrtzVpx9ou1zElr9MVmtnw87ARuabdcv8epDcbAW/Py7pNo9ew7vX7JXkby/3fqa2zBnUcR9pRjgFOzMP+BziaSrD3tXykTxyzgbGVbeC1uft3wEG5e2TttalsR6vmaXwXuKsy7mf5b2Vg8zz9m/O4VXL/B/NrtzXpjXjzPP4J4G25e43aOmuw7LVt4LN53e9HCr/aAdCAtp/e1m2lfyXSG/daeX5PkvbRVfO4F0lvaCNI+9cxpO1uZ9Kb1Ka9LMe7gTuAUXlb2QxYJ4/7IWnfHZdftzfn9f064AXS9j6CdMA4A1i+sj3dBayXaxtHegPbnXRg987cP6aZ7Zsmsi5P9w7gS3m5NyId0Ly7sj5fBiblxy62zv85v6EI9UZhXBl+C/kItm5h/x/pqHrj/qbFovDcqMGwarCfUBm/OSmIhrH0wT4V+M/KuE3zCh9eqWPdyvjbgP2XYl3+mkUBewCVo0/SEcjBufudwJ9y99qkN5SVKtM5ALi+smPO6me+k4Df5+6JpJ1QlfE3V16/k4Gv1j3/IeDtzWz4leHzgMm9POcy4LDc/arXsO712w/4Te4elqe5bS/TPI4U4OuTDjpG5P/r8epg73X5SG+I80mfGEbUPWYa8BVgrX7W9ai8TlbPNb9MJcioHLHn5bup7vn/C3w5d88CPgqs1s88PwDMrXtNbyMdSAzG9nMci+9HN5EOCrYHfgVcSDq63wm4Oz/mbfk1W67yvPOpfHqqm+bOpGaz7euesxzpzeKNDZ7zX8CFdY+dQz4Kz9vThyrjjyQfvFWGXQNMaWb7pomsIx00zKobdjTw08r6nNbXOq/9teOsmHGkjx/1vkF6x/yVpEckHdXEtGYPYPxM0k67VlNV9m1snl512sNJO0PNvEr3X0lHa69SOZPneUnPN5qRpPVIG/25edDlwIqko1mA80g7HMD7cz+ko/kRwBP5y+sFpJ3/NZXJv2r9SVpb0s8kzZH0F1Kw1dbXWGBO5C2swfM3AA6vzSvPb738vKZIGkH6pPBM7t9N0i2SnsnT253mXr/Lgc0ljSe92T0bEbf19YSImEXa/o4HHo6I+m2r1+WLiBnAZ0g73vy8DmvLfQjp6PBBSbdL2jMv2zBJJ0j6U17Xj+XHr5XXwXBevX7r1/V2dbVMJjVDAbyXtK5mSrpR0g59LHr9azqT9JoNePtp0o2kN+WJufsG0pvj23M/ef6zI+KVurrGAUi6r7LfvC0iriM1J/2QtP5PkbQaaV2uCPypQR2v2ofzvGbX5tFg+TYA3le3zt8KrDPwVdBr1m0AjK2bxzG8OleaWuctDXZJbyKtuJvrx0XEcxFxeERsRGr7+pykXWqje5lkb8Nr1qt0r086CnqK9BFs5Updw0g7U7PTnUt6EarTXkj6aNm0WHQmz8hIXyI2chDpdfqFpHmkj2YrkpoCILXT7ihpXeDfWRTss0lHXGtFxKj8t1pEbFEtoW5ex+dhb4iI1YADSR8RIX28HydJlcdX1+9s4L8r8xoVEStHxPnNrQ0A9iatx9skrUBqPvsmsHZEjCI1saiP56eFivgb6UjwQNL6O7vJ+Z8FHJ7/1+tz+SLivIh4K2m7CODEPPzhiDiAFIgnAhdLWoX0Jrw36Sh/ddInPfLy9eT1sG5l/vXr+sa6WkZGxMfzPG+PiL3zPC/L66I39a/p+qTte0m2n3qNxtcH+40sHuxzgfWqZ9Dluubk5duist/clIedFBH/Rvpk/jrgC6R9/W+k5rx6r9qH8zpYrzaPBvXPJh2xV9f5KhFxQi/L/lcqGcOiN92+sm428GjdPFaNiN17qalXLQl2SavlI5WfkT6a3dPgMXtK2jiv4GeBf5C+NIUUmBstwawPlLS5pJVJH38ujnQ65B+BFSXtkY8Sv0hqd6t5EtiwbsOqOh/4rKTxkkaSAvGCiFi4BDX2Zwrpo/y/Vv7eC+wuac2I6CEd9fyUtFE8ABART5A+6n4rr//lJL1W0tv7mNeqpC+6npU0jrRz1PyO9Jp8UtJwSXuTvhis+QnwMUnbKVklr99V+1tASaMlTSYdcZ0YEU+T2hhXIIecpN2Ad/U3rYqzSM0F76H5YL8gz6NREPa6fJI2lbRzfjP6G+nj/yt52Q6UNCYfES7I03qFtK7/TmqnXZm0DQGQt9FLgeMkrSzp9bz6rJ0rgddJOkjSiPz3JkmbSVpe0mRJq0fEy6Qv2apHvvVeA3w6T+N9pPbpXy7h9lOv0X70W1LT5bbAbRFxH/kTCKnZCuBWUjAekevaEdiLlB+Lycu+Xd6XXyC9Bq/kdX468G1JY/OnpB3y63QhsIekXfLzDie9Hr/tZVnOAfaS9O48nRWVTkFet5fH3wW8Pz92V9IbV63e3rLuNuA5SUdKWik/d8t8QDwgQx3sv5D0HOmd6Fjg26QvfBrZhNSW/DwpRH4UEdfncV8Hvpg/nnx+APM/m9S2NY90lPtpgIh4FvhP4FTSO/QLwOOV512U/z8t6c4G0z09T3sa6Zvrv5G+RBpUkrYnbfQ/jIh5lb8rSB/lak0w55GO/M6rm8TBpIC8H/gz6Rv1vj46foV0BsmzwFWkcAEgIl4itY0eQgqoA0kB8/c8fjrwEdJH4j/n+j7QzyL+QakJagbwYeCzEfGlPL3nSK/XhXl67weu6Gd6/xQRvyHtLHdGxMz+Hp+f82JE/DoiXmwwrq/lW4F0Ou9TpG3tNaS2UUjtx/fl5fwe6buWF0lvPDNJ29/9pO+eqj5JOpKfR9rWzmfRun6O9Aa0P+nIcx7p00Dt4OQg4DGlJp6PkZppenMrad97CvhvYJ/8xgoD337qLbYfRcQLwJ3AfXmbgrS/z4yI+fkxL5GCfLdc149I3yM92Mt8ViO98f6ZtE6fJjV3AHyedJbM7aQmvhNJ7fAPkbbh7+d57EU6PfslGshNc3uTmkZ6SJn2BXrP0MPyNGvNZJdVxjXMuvyGvifp4O3RXNeppO1gQGpnnZgNmKRbgR9HxE/bXUsjkq4DzouIU9tdy9KSdCLwLxExpd8HNz/ND5BOCHjrYE3TOoOvFWNNk/R2Sf+Sm2KmAFsBV7e7rkbyx9dtSM0rXUfS6yVtlZt9tiV9Uvp5u+uy7tCRv6iyjrUpqWlkFdKXuPvkttiOIulM0qmah+Vmi260Kqn5ZSyprfpbpLN9zPrlphgzs8K4KcbMrDBd3RSz6667xtVXd2QTr5ktu/r9rcVQ6+oj9qeeeqrdJZiZdZyuDnYzM1ucg93MrDAOdjOzwjjYzcwK42A3MyuMg93MrDAOdjOzwjjYzcwK42A3MyuMg93MrDBDFuySTpc0X9K9lWGjJV0r6eH8f408XJJOkjRD0t2SthmquszMSjeUR+xnkG4LVnUUMDUiNgGm5n5It8DaJP8dCpw8hHWZmRVtyII9IqaR7jFYtTdwZu6u3QyhNvysSG4BRkkayL0Vzcwsa/Vle9eu3HFnHrB27h5HujlszeN52GJ355F0KOmonvXXX3/oKu0Qk/bYiWd65jYcN3rMWC676vqG48xs2dW267FHREga8O2bIuIU4BSACRMmFH/7p2d65jLt+LENx008pnHgm9myrdVnxTxZa2LJ/+fn4XOA9SqPWzcPMzOzAWp1sF8BTMndU1h0c94rgIPz2THbA8924k2Szcy6wZA1xUg6H9gRWEvS48CXgROACyUdAswE9s0P/yWwOzAD+CvwwaGqy8ysdEMW7BFxQC+jdmnw2AA+MVS1mJktS7r6Ztat5jNUzKwbONgHwGeomFk38LVizMwK42A3MyuMg93MrDAOdjOzwjjYzcwK42A3MyuMg93MrDA+j70D9PXDp7lzZgONz503M2vEwd4B+vrh0/jJj7a4GjPrdm6KMTMrjI/Yu9jMWbOZuO2mDcf52jVmyy4HexdbLhb62jVmthgH+yDx0bOZdQoH+yDx0bOZdQp/eWpmVhgHu5lZYRzsZmaFcbCbmRXGwW5mVhgHu5lZYRzsZmaFcbCbmRXGwW5mVhgHu5lZYRzsZmaFcbCbmRXGwW5mVhgHu5lZYRzsZmaFcbCbmRXGN9pogb7urgQwd85soPFNOszMBsrB3gJ93V0JYPzkR1tYjZmVzk0xZmaFcbCbmRXGwW5mVhgHu5lZYfzlaaH6OxNn9JixXHbV9S2syMxaxcFeqP7OxJl4zNwWVmNmreSmGDOzwjjYzcwK42A3MyuMg93MrDAOdjOzwjjYzcwK42A3MyuMg93MrDAOdjOzwrQl2CV9VtJ9ku6VdL6kFSWNl3SrpBmSLpC0fDtqMzPrdi0PdknjgE8DEyJiS2AYsD9wIvCdiNgY+DNwSKtrMzMrQbuaYoYDK0kaDqwMPAHsDFycx58JTGpTbWZmXa3lwR4Rc4BvArNIgf4scAewICIW5oc9Doxr9HxJh0qaLml6T09PK0o2M+sq7WiKWQPYGxhPuoPzKsCuzT4/Ik6JiAkRMWHMmDFDVKWZWfdqR1PMO4BHI6InIl4GLgXeAozKTTMA6wJz2lCbmVnXa0ewzwK2l7SyJAG7APcD1wP75MdMAS5vQ21mZl2vHW3st5K+JL0TuCfXcApwJPA5STOANYHTWl2bmVkJ2nIHpYj4MvDlusGPANu2oRwzs6L4l6dmZoVxsJuZFcbBbmZWGAe7mVlhHOxmZoVxsJuZFcbBbmZWGAe7mVlhHOxmZoVxsJuZFcbBbmZWGAe7mVlhHOxmZoVxsJuZFcbBbmZWGAe7mVlhHOxmZoVxsJuZFcbBbmZWGAe7mVlhHOxmZoVxsJuZFcbBbmZWGAe7mVlhhre7gE4zaY+deKZnbsNxc+fMBsa2tiAzswFysNd5pmcu045vHN7jJz/a4mrMzAbOTTFmZoVxsJuZFcbBbmZWGAe7mVlhHOxmZoVxsJuZFcbBbmZWGAe7mVlhHOxmZoVxsJuZFcbBbmZWGAe7mVlhHOxmZoVxsJuZFcbBbmZWGAe7mVlhHOxmZoVxsJuZFcbBbmZWGAe7mVlhHOxmZoVxsJuZFcbBbmZWGAe7mVlh2hLskkZJuljSg5IekLSDpNGSrpX0cP6/RjtqMzPrdu06Yv8ecHVEvB54I/AAcBQwNSI2AabmfjMzG6CWB7uk1YGJwGkAEfFSRCwA9gbOzA87E5jU6trMzErQjiP28UAP8FNJv5d0qqRVgLUj4on8mHnA2o2eLOlQSdMlTe/p6WlRyWZm3aMdwT4c2AY4OSK2Bl6grtklIgKIRk+OiFMiYkJETBgzZsyQF2tm1m3aEeyPA49HxK25/2JS0D8paR2A/H9+G2ozM+t6LQ/2iJgHzJa0aR60C3A/cAUwJQ+bAlze6trMzEowvE3z/RRwrqTlgUeAD5LeZC6UdAgwE9i3TbWZmXW1tgR7RNwFTGgwapdW12JmVhr/8tTMrDAOdjOzwjjYzcwK01SwS3pLM8PMzKz9mj1i/36Tw8zMrM36PCtG0g7Am4Exkj5XGbUaMGwoCzMzsyXT3+mOywMj8+NWrQz/C7DPUBVlZmZLrs9gj4gbgRslnRERM1tUk5mZLYVmf6C0gqRTgA2rz4mInYeiKDMzW3LNBvtFwI+BU4F/DF05Zma2tJoN9oURcfKQVmJmZoOi2dMdfyHpPyWtk+9NOlrS6CGtzMzMlkizR+y1y+l+oTIsgI0GtxwzM1taTQV7RIwf6kLMzGxwNBXskg5uNDwizhrccszMbGk12xTzpkr3iqTrpt8JONjNzDpMs00xn6r2SxoF/GxIKjIzs6WypHdQegFwu3sXmzlrNhO33bThuNFjxnLZVde3uCIzGyzNtrH/gnQWDKSLf20GXDhURdnQWy4WMu34sQ3HTTxmbourMbPB1OwR+zcr3QuBmRHx+BDUY2ZmS6mpHyjli4E9SLrC4xrAS0NZlJmZLblm76C0L3Ab8D5gX+BWSb5sr5lZB2q2KeZY4E0RMR9A0hjg18DFQ1WYmZktmWavFbNcLdSzpwfwXDMza6Fmj9ivlnQNcH7u3w/45dCUZGZmS6O/e55uDKwdEV+Q9B/AW/Oo3wHnDnVxZmY2cP0dsX8XOBogIi4FLgWQ9IY8bq8hrc7MzAasv3bytSPinvqBediGQ1KRmZktlf6CfVQf41YazELMzGxw9Bfs0yV9pH6gpA8DdwxNSWZmtjT6a2P/DPBzSZNZFOQTgOWBfx/KwszMbMn0GewR8STwZkk7AVvmwVdFxHVDXpmZmS2RZq/Hfj3g67iamXUB/3rUzKwwDnYzs8I42M3MCuNgNzMrjIPdzKwwDnYzs8I42M3MCuNgNzMrjIPdzKwwDnYzs8I42M3MCuNgNzMrjIPdzKwwDnYzs8I42M3MCuNgNzMrTNuCXdIwSb+XdGXuHy/pVkkzJF0gafl21WZm1s3aecR+GPBApf9E4DsRsTHwZ+CQtlRlZtbl2hLsktYF9gBOzf0CdgYuzg85E5jUjtrMzLpdu47YvwscAbyS+9cEFkTEwtz/ODCu0RMlHSppuqTpPT09Q1+pmVmXaXmwS9oTmB8RdyzJ8yPilIiYEBETxowZM8jVmZl1v+FtmOdbgPdI2h1YEVgN+B4wStLwfNS+LjCnDbWZmXW9lh+xR8TREbFuRGwI7A9cFxGTgeuBffLDpgCXt7o2M7MSdNJ57EcCn5M0g9Tmflqb6zEz60rtaIr5p4i4Abghdz8CbNvOeszMStBJR+xmZjYIHOxmZoVxsJuZFcbBbmZWGAe7mVlhHOxmZoVxsJuZFcbBbmZWGAe7mVlhHOxmZoVxsJuZFcbBbmZWGAe7mVlhHOxmZoVxsJuZFcbBbmZWGAe7mVlh2noHJetMM2fNZuK2mzYcN3rMWC676voWV2RmA+Fgt8UsFwuZdvzYhuMmHjO3xdWY2UC5KcbMrDAOdjOzwjjYzcwK42A3MyuMg93MrDAOdjOzwjjYzcwK42A3MyuMg93MrDAOdjOzwjjYzcwK42A3MyuMg93MrDDL3NUdJ+2xE8/09H6FwrlzZgONr2xoZtYNlrlgf6Znbq+XpAUYP/nRFlZjZjb43BRjZlYYB7uZWWEc7GZmhXGwm5kVxsFuZlYYB7uZWWEc7GZmhXGwm5kVxsFuZlYYB7uZWWEc7GZmhXGwm5kVxsFuZlYYB7uZWWEc7GZmhWl5sEtaT9L1ku6XdJ+kw/Lw0ZKulfRw/r9Gq2szMytBO47YFwKHR8TmwPbAJyRtDhwFTI2ITYCpud/MzAao5cEeEU9ExJ25+zngAWAcsDdwZn7YmcCkVtdmZlaCtraxS9oQ2Bq4FVg7Ip7Io+YBa7epLDOzrta2YJc0ErgE+ExE/KU6LiICiF6ed6ik6ZKm9/T0tKBSM7Pu0pZglzSCFOrnRsSlefCTktbJ49cB5jd6bkScEhETImLCmDFjWlOwmVkXacdZMQJOAx6IiG9XRl0BTMndU4DLW12bmVkJhrdhnm8BDgLukXRXHnYMcAJwoaRDgJnAvm2ozcys67U82CPiZkC9jN6llbWYmZWoHUfsVqhJe+zEMz1zG44bPWYsl111fYsrMls2Odht0DzTM5dpx49tOG7iMY0D38wGn68VY2ZWGAe7mVlhHOxmZoVxsJuZFcZfntqAzJw1m4nbbtpw3Nw5s4HGX572x2fUmA0eB7sNyHKxsNczX8ZPfnSJp+szaswGj5tizMwK42A3MyuMg93MrDAOdjOzwjjYzcwK42A3MyuMg93MrDAOdjOzwjjYzcwK42A3MyuMg93MrDAOdjOzwjjYzcwK42A3MyuMg93MrDAOdjOzwvhGG9YSfd15CZbu7ktLyndtslI52K0l+rrzEizd3ZeWlO/aZKVyU4yZWWEc7GZmhXGwm5kVxsFuZlYYB7uZWWEc7GZmhfHpjtbVfC662eIc7NbVfC662eLcFGNmVhgHu5lZYRzsZmaFcbCbmRXGX55ax+vrypB9XRWyE68oadYKDnbreH1dGbKvq0J24hUlzVrBTTFmZoVxsJuZFcbBbmZWGAe7mVlh/OWp2QD5+jTW6RzsZgPk69NYp3NTjJlZYXzEbjaI+vtRVDuaatx0tOxxsJsNov5+FNWOpho3HS173BRjZlaYjjpil7Qr8D1gGHBqRJzQ5pJsGbWk16dZGkvaZNLX82Bo6l2a5p2hWM6laVIqsamqY4Jd0jDgh8A7gceB2yVdERH3t7cyWxYt6fVplsaSNpn09TwYmnqXpnlnKJZzaZqUSmyq6qSmmG2BGRHxSES8BPwM2LvNNZmZdR1FRLtrAEDSPsCuEfHh3H8QsF1EfLLucYcCh+beTYGH6ia1FvDUEJc7VLq5duju+ru5duju+kur/amI2LUdxdR0TFNMsyLiFOCU3sZLmh4RE1pY0qDp5tqhu+vv5tqhu+t37YOvk5pi5gDrVfrXzcPMzGwAOinYbwc2kTRe0vLA/sAVba7JzKzrdExTTEQslPRJ4BrS6Y6nR8R9SzCpXptpukA31w7dXX831w7dXb9rH2Qd8+WpmZkNjk5qijEzs0HgYDczK0wxwS5pV0kPSZoh6ah219MfSetJul7S/ZLuk3RYHj5a0rWSHs7/12h3rb2RNEzS7yVdmfvHS7o1vwYX5C/BO5KkUZIulvSgpAck7dAt617SZ/M2c6+k8yWt2MnrXtLpkuZLurcyrOG6VnJSXo67JW3Tvsp7rf0bebu5W9LPJY2qjDs61/6QpHe3p+pCgr1yOYLdgM2BAyRt3t6q+rUQODwiNge2Bz6Raz4KmBoRmwBTc3+nOgx4oNJ/IvCdiNgY+DNwSFuqas73gKsj4vXAG0nL0fHrXtI44NPAhIjYknSiwf509ro/A6j/wU5v63o3YJP8dyhwcotq7M0ZLF77tcCWEbEV8EfgaIC8/+4PbJGf86OcTS1XRLDThZcjiIgnIuLO3P0cKVjGkeo+Mz/sTGBSeyrsm6R1gT2AU3O/gJ2Bi/NDOrn21YGJwGkAEfFSRCygS9Y96Wy2lSQNB1YGnqCD131ETAOeqRvc27reGzgrkluAUZLWaU2li2tUe0T8KiIW5t5bSL+5gVT7zyLi7xHxKDCDlE0tV0qwjwNmV/ofz8O6gqQNga2BW4G1I+KJPGoesHabyurPd4EjgFdy/5rAgsoG38mvwXigB/hpbko6VdIqdMG6j4g5wDeBWaRAfxa4g+5Z9zW9retu25c/BPxf7u6Y2ksJ9q4laSRwCfCZiPhLdVykc1E77nxUSXsC8yPijnbXsoSGA9sAJ0fE1sAL1DW7dPC6X4N0ZDiedC3eVVi8qaCrdOq67o+kY0lNque2u5Z6pQR7V16OQNIIUqifGxGX5sFP1j565v/z21VfH94CvEfSY6Rmr51JbdajcvMAdPZr8DjweETcmvsvJgV9N6z7dwCPRkRPRLwMXEp6Pbpl3df0tq67Yl+W9AFgT2ByLPoxUMfUXkqwd93lCHKb9GnAAxHx7cqoK4ApuXsKcHmra+tPRBwdEetGxIakdX1dREwGrgf2yQ/ryNoBImIeMFtS7U4auwD30wXrntQEs72klfM2VKu9K9Z9RW/r+grg4Hx2zPbAs5Umm46gdEOgI4D3RMRfK6OuAPaXtIKk8aQvgG9rR41ERBF/wO6kb6j/BBzb7nqaqPetpI+fdwN35b/dSW3VU4GHgfx7mhQAAAZcSURBVF8Do9tdaz/LsSNwZe7eiLQhzwAuAlZod3191P2vwPS8/i8D1uiWdQ98BXgQuBc4G1ihk9c9cD7p+4CXSZ+WDultXQMineH2J+Ae0tk/nVb7DFJbem2//XHl8cfm2h8CdmtX3b6kgJlZYUppijEzs8zBbmZWGAe7mVlhHOxmZoVxsJuZFcbBbmZWGAf7MkjSJEkh6fXtrqUZudZzKv3DJfXULhdsZq/mYF82HQDcnP8vlRZdlvQFYEtJK+X+d9KBPzNvpcrlA4qalw0OB/syJl907K2kX9Dtr3SDkosq43es3DjjXZJ+J+lOSRfl5yLpMUknSroTeJ+kj0i6XdIfJF0iaeX8uNdKukXSPZK+Jun5yny+kJ9zt6SvNFH6L0mXCYb0hnR+ZVqr5Bsi3Jav1rh3Hr5FHnZXns8m+bFX5VrvlbRffuyXcj33Sjol/1wfSW/Kz70r32Dh3jx8WO6vLcNH8/B1JE3Lj79X0tv6eC2el/QdpZtmTJU0prLerpZ0h6Sbap+sJJ0h6ceSbgX+p5dpHifp85X+eyVt2Mdy/5ukG/O8rqlcv+UGSd+VNJ103X3rJu3+ubH/WvsHTAZOy92/BbYjXX9klTzsZOBAYC1gWmX4kcCXcvdjwBGVaa5Z6f4a8KncfSVwQO7+GPB87n4X6e7uIh1cXAlM7KPm54GtSBfrWpH0M+4dWXQpg+OBA3P3KNKlJVYBvk+6SBPA8sBKwHuBn1SmvXr+P7oy7Gxgr9x9L7BD7j4BuDd3Hwp8MXevQLo8wXjgcPIlLUg3wVi1j+WKSn1fAn6Qu6cCm+Tu7UjX4oF004crgWF9TPM44POV/nuBDRstNzAibwNj8rD9gNNz9w3Aj9q9vfpvyf78EWvZcwDpSoyQrsz4PuBqYC9JF5OOio8A3k66G9Vv8sHr8sDvKtO5oNK9paSvkUJ1JHBNHr4Di26gcB7pOuKQgv1dwO9z/0jSBZOm9VZ0RNytdN36A0hH71XvIl1tsnakuiKwfq73WKWbglwaEQ9Lugf4lqQTSW8MN+Xn7CTpCNKNK0YD90m6iRTMteU+j3RFv9o8t5JUu/DW6nkZbgdOV7py52URcVdvy0S6ln1tPZ4DXJo/Fb0ZuCivd0hvHDUXRcQ/+phmbxZbbklbAlsC1+Z5DSNdF6XmgsUnY93Awb4MkTSadIndN0gK0o4cwAeBT5DuFDM9Ip7LTRHXRkRv7fAvVLrPACZFxB+ULme6Y3+lAF+PiP8d4CJcQXpz2JF0Eanq9N4bEQ/VPf6B3GyxB/BLSR+NiOuU7qO5O/A1SVNJzRo/Il1warak40hvDv0tw6ci4prFRkgT8zzPkPTtiDiryeUL0ieYBRHxr7085oVehtcs5NVNrCsCRMQfGyz3z4H7ImKHJZyXdSi3sS9b9gHOjogNImLDiFgPeJQUBtsAHyEdxUO65ddbJG0M/2zHfl0v010VeCIfpU6uDL+F1AQA6fK+NdcAH6q02Y+T9Jom6j8d+EpE3FM3/BrgU5V28a3z/42ARyLiJNJlYbeSNBb4a0ScA3wjL3ctxJ/KNe0DEOl2ec9J2q6XZfh4XmYkvS6vow2AJyPiJ6TbBvZ1M+blWHSp3fcDN0e62cqjkt6XpytJb2xi3dQ8VptnDvLxubvRcj8EjJG0Q37MCElbDGBe1qF8xL5sOYB00+OqS0iBdSXwAfI1siOiJx99ny+p1hTwRVL7db3/It3Wryf/XzUP/wxwjtKdZq4m3caNiPiVpM2A3+Usfp7Urt/njS0i4nHgpAajvkq6Vd/dkpYjvVntCewLHCTpZdLt144H3gR8Q9IrpEuxfjwiFkj6Cak9eh6pOaXmEOAn+fE31paBFNobAnfmN5QeUrPTjsAX8jyfBw7uY5FeALaV9MW87Pvl4ZOBk/PwEaQ32z/0tW4qLiFdz/w+0mtRe73e0GC5X8pNSScp3Qd2OGk93tfkvKxD+bK9NmSUzo55MSJC0v6kL1I7+ibj9SSNjIjnc/dRwDoRMShniUh6PiJGDsa0zKp8xG5D6d+AH+Qj2gWkG/92mz0kHU3aV2aSPtWYdTQfsVtHkFS7o069XSLi6VbXM5jyF7gr1A0+qMF3BQOZ5gdZ/Pzy30TEJ5Z0mlYOB7uZWWF8VoyZWWEc7GZmhXGwm5kVxsFuZlaY/w9Hh9oVCJ1OigAAAABJRU5ErkJggg==\n",
+            "text/plain": [
+              "<Figure size 360x360 with 1 Axes>"
+            ]
+          },
+          "metadata": {
+            "tags": [],
+            "needs_background": "light"
+          }
+        }
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/",
+          "height": 255
+        },
+        "id": "FikU2DEOYwuN",
+        "outputId": "410b61b9-d580-42a7-93d8-0d1ed01e2e1a"
+      },
+      "source": [
+        "activityAndChange.head(5)"
+      ],
+      "execution_count": 227,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "text/html": [
+              "<div>\n",
+              "<style scoped>\n",
+              "    .dataframe tbody tr th:only-of-type {\n",
+              "        vertical-align: middle;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe tbody tr th {\n",
+              "        vertical-align: top;\n",
+              "    }\n",
+              "\n",
+              "    .dataframe thead th {\n",
+              "        text-align: right;\n",
+              "    }\n",
+              "</style>\n",
+              "<table border=\"1\" class=\"dataframe\">\n",
+              "  <thead>\n",
+              "    <tr style=\"text-align: right;\">\n",
+              "      <th></th>\n",
+              "      <th>0</th>\n",
+              "      <th>1</th>\n",
+              "      <th>2</th>\n",
+              "      <th>3</th>\n",
+              "      <th>4</th>\n",
+              "      <th>5</th>\n",
+              "      <th>6</th>\n",
+              "      <th>7</th>\n",
+              "      <th>8</th>\n",
+              "      <th>9</th>\n",
+              "      <th>10</th>\n",
+              "      <th>11</th>\n",
+              "      <th>12</th>\n",
+              "      <th>13</th>\n",
+              "      <th>14</th>\n",
+              "      <th>15</th>\n",
+              "      <th>16</th>\n",
+              "      <th>17</th>\n",
+              "      <th>18</th>\n",
+              "      <th>19</th>\n",
+              "      <th>20</th>\n",
+              "      <th>21</th>\n",
+              "      <th>22</th>\n",
+              "      <th>23</th>\n",
+              "      <th>24</th>\n",
+              "      <th>25</th>\n",
+              "      <th>26</th>\n",
+              "      <th>27</th>\n",
+              "      <th>28</th>\n",
+              "      <th>Change</th>\n",
+              "      <th>Total_Messages_per_user</th>\n",
+              "      <th>Average_Messages_per_user</th>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>userid</th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "      <th></th>\n",
+              "    </tr>\n",
+              "  </thead>\n",
+              "  <tbody>\n",
+              "    <tr>\n",
+              "      <th>+/wAfc2I0c831C21wvh2Kcr4DZk=</th>\n",
+              "      <td>33.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>30.0</td>\n",
+              "      <td>24.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>29.0</td>\n",
+              "      <td>37.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>19.0</td>\n",
+              "      <td>22.0</td>\n",
+              "      <td>46.0</td>\n",
+              "      <td>23.0</td>\n",
+              "      <td>106.0</td>\n",
+              "      <td>23.0</td>\n",
+              "      <td>19.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>15.0</td>\n",
+              "      <td>19.0</td>\n",
+              "      <td>54.0</td>\n",
+              "      <td>33.0</td>\n",
+              "      <td>14.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>33.0</td>\n",
+              "      <td>-0.25</td>\n",
+              "      <td>613.0</td>\n",
+              "      <td>22.703704</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+0pfU/ormz318pPBTZ6cWtrgHkI=</th>\n",
+              "      <td>103.0</td>\n",
+              "      <td>74.0</td>\n",
+              "      <td>11.0</td>\n",
+              "      <td>37.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>64.0</td>\n",
+              "      <td>67.0</td>\n",
+              "      <td>19.0</td>\n",
+              "      <td>51.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>50.0</td>\n",
+              "      <td>22.0</td>\n",
+              "      <td>57.0</td>\n",
+              "      <td>47.0</td>\n",
+              "      <td>9.0</td>\n",
+              "      <td>43.0</td>\n",
+              "      <td>15.0</td>\n",
+              "      <td>18.0</td>\n",
+              "      <td>23.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>40.0</td>\n",
+              "      <td>2.0</td>\n",
+              "      <td>26.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>9.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>56.0</td>\n",
+              "      <td>-0.00</td>\n",
+              "      <td>734.0</td>\n",
+              "      <td>27.185185</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+4XFQAS/fIojw07hLfZk6PZiGzA=</th>\n",
+              "      <td>145.0</td>\n",
+              "      <td>103.0</td>\n",
+              "      <td>119.0</td>\n",
+              "      <td>34.0</td>\n",
+              "      <td>79.0</td>\n",
+              "      <td>31.0</td>\n",
+              "      <td>44.0</td>\n",
+              "      <td>22.0</td>\n",
+              "      <td>39.0</td>\n",
+              "      <td>63.0</td>\n",
+              "      <td>130.0</td>\n",
+              "      <td>47.0</td>\n",
+              "      <td>19.0</td>\n",
+              "      <td>43.0</td>\n",
+              "      <td>37.0</td>\n",
+              "      <td>25.0</td>\n",
+              "      <td>12.0</td>\n",
+              "      <td>1.0</td>\n",
+              "      <td>64.0</td>\n",
+              "      <td>27.0</td>\n",
+              "      <td>57.0</td>\n",
+              "      <td>68.0</td>\n",
+              "      <td>84.0</td>\n",
+              "      <td>192.0</td>\n",
+              "      <td>5.0</td>\n",
+              "      <td>71.0</td>\n",
+              "      <td>45.0</td>\n",
+              "      <td>21.0</td>\n",
+              "      <td>45.0</td>\n",
+              "      <td>-0.00</td>\n",
+              "      <td>1482.0</td>\n",
+              "      <td>54.888889</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+6hscmdASu/PfR0HuiO9AzKlNdQ=</th>\n",
+              "      <td>52.0</td>\n",
+              "      <td>81.0</td>\n",
+              "      <td>63.0</td>\n",
+              "      <td>456.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>129.0</td>\n",
+              "      <td>63.0</td>\n",
+              "      <td>361.0</td>\n",
+              "      <td>136.0</td>\n",
+              "      <td>45.0</td>\n",
+              "      <td>20.0</td>\n",
+              "      <td>70.0</td>\n",
+              "      <td>21.0</td>\n",
+              "      <td>54.0</td>\n",
+              "      <td>4.0</td>\n",
+              "      <td>26.0</td>\n",
+              "      <td>24.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>8.0</td>\n",
+              "      <td>11.0</td>\n",
+              "      <td>28.0</td>\n",
+              "      <td>3.0</td>\n",
+              "      <td>52.0</td>\n",
+              "      <td>8.0</td>\n",
+              "      <td>30.0</td>\n",
+              "      <td>-0.00</td>\n",
+              "      <td>1663.0</td>\n",
+              "      <td>61.592593</td>\n",
+              "    </tr>\n",
+              "    <tr>\n",
+              "      <th>+9kMKboj6nxl0kWR3t90grCXt5k=</th>\n",
+              "      <td>56.0</td>\n",
+              "      <td>24.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>10.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>65.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>18.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>8.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>23.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>28.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>24.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>0.0</td>\n",
+              "      <td>-0.75</td>\n",
+              "      <td>200.0</td>\n",
+              "      <td>7.407407</td>\n",
+              "    </tr>\n",
+              "  </tbody>\n",
+              "</table>\n",
+              "</div>"
+            ],
+            "text/plain": [
+              "                                  0  ...  Average_Messages_per_user\n",
+              "userid                               ...                           \n",
+              "+/wAfc2I0c831C21wvh2Kcr4DZk=   33.0  ...                  22.703704\n",
+              "+0pfU/ormz318pPBTZ6cWtrgHkI=  103.0  ...                  27.185185\n",
+              "+4XFQAS/fIojw07hLfZk6PZiGzA=  145.0  ...                  54.888889\n",
+              "+6hscmdASu/PfR0HuiO9AzKlNdQ=   52.0  ...                  61.592593\n",
+              "+9kMKboj6nxl0kWR3t90grCXt5k=   56.0  ...                   7.407407\n",
+              "\n",
+              "[5 rows x 32 columns]"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 227
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "7l-DuJq65uAm"
+      },
+      "source": [
+        "## Result 2. Pearsons r correlation - Change in bond score and user messages"
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/"
+        },
+        "id": "3OvA46OnZAXW",
+        "outputId": "7cc6e837-a8f1-485d-b258-cf3ecc93de53"
+      },
+      "source": [
+        "corr2, _ = pearsonr(activityAndChange['Change'], activityAndChange['Total_Messages_per_user'])\n",
+        "print('Pearsons correlation: %.3f' % corr2)"
+      ],
+      "execution_count": 228,
+      "outputs": [
+        {
+          "output_type": "stream",
+          "text": [
+            "Pearsons correlation: 0.022\n"
+          ],
+          "name": "stdout"
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "QOFpN_aI5qxA"
+      },
+      "source": [
+        "The Pearsons correaltion of 0.022 indicates no correlation between change in bond score, and user engagement."
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "E0mvUH-J6kk0"
+      },
+      "source": [
+        "## Test 3. Statistical testing of the mean of two groups: low bond score and high bond score"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "FvpFHmi-7B0A"
+      },
+      "source": [
+        "In this final test: \n",
+        "\n",
+        "1.   The data is sorted by bond score from timepoint one, from lowest to highest\n",
+        "2.   The messages column is split in two; half of the message totals relating to low bond scores are in one list, and the other half relating to high bond scores are in the other.\n",
+        "3.   The two lists are tested for normality using a Shapiro-Wilkes test, the lists are identified to be non-parametric\n",
+        "4. A Mann Whitney U test is implemented to compare the two groups, and understand whether there is a significant difference in the total message volumes (and the engagement) of the users with low bond scores, and those with high bond scores\n",
+        "3.   The null hypothesis, or baseline assumption that we make,  is that there is no significant difference in the mean number of messages sent per user between the low bond-score group and high bond-score group.\n",
+        "\n",
+        "\n"
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "YzjZ7qXdjz9F"
+      },
+      "source": [
+        "sortedByBond = bondAndEngagement"
+      ],
+      "execution_count": 154,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "w4eb_E0Pl73H"
+      },
+      "source": [
+        "sortedByBond.sort_values(by=['early_bond'], inplace=True)"
+      ],
+      "execution_count": 156,
+      "outputs": []
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "B3c-4FIsnIkc"
+      },
+      "source": [
+        "Now that the dataframe is ordered by bond score, Let's split the totoal messages data into two lists, the total message numbers for the lower scores, and the total messages for the higher scores.\n",
+        "\n"
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "G03XikqMna1f"
+      },
+      "source": [
+        "len(sortedMerged)\n",
+        "lower = sortedMerged[\"total_messages\"].iloc[:2188]\n",
+        "higher = sortedMerged[\"total_messages\"].iloc[2188:]"
+      ],
+      "execution_count": 164,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "RHqlhOfYoTYR"
+      },
+      "source": [
+        "lower = list(lower)\n",
+        "higher = list(higher)"
+      ],
+      "execution_count": 168,
+      "outputs": []
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "kxRXlYsxoywh"
+      },
+      "source": [
+        "Shapiro-Wilkes tests below tell us that the distributions of the lists are non-Gaussian, meaning we will use non-parametric testing.\n",
+        "\n",
+        "Alpha is set to 0.5\n",
+        "\n",
+        "Instead of using a parametric Students t-test, we can use a Mann-Whitney U test.\n",
+        "\n",
+        "The Null hypothesis is that there is no difference in the mean number of messages sent between the low-score and high-score groups."
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/"
+        },
+        "id": "kNdl8R9Vodt2",
+        "outputId": "6c51cd82-7472-4315-9d43-9aef5a02d677"
+      },
+      "source": [
+        "stat, p = shapiro(lower)\n",
+        "print('Statistics=%.3f, p=%.3f' % (stat, p))\n",
+        "# interpret\n",
+        "alpha = 0.05\n",
+        "if p > alpha:\n",
+        "\tprint('Sample looks Gaussian (fail to reject H0)')\n",
+        "else:\n",
+        "\tprint('Sample does not look Gaussian (reject H0)')"
+      ],
+      "execution_count": 169,
+      "outputs": [
+        {
+          "output_type": "stream",
+          "text": [
+            "Statistics=0.792, p=0.000\n",
+            "Sample does not look Gaussian (reject H0)\n"
+          ],
+          "name": "stdout"
+        }
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/"
+        },
+        "id": "Q6gG3LCuouKl",
+        "outputId": "b9e9fcd7-0f53-4904-b689-a4df1d3f1f14"
+      },
+      "source": [
+        "stat, p = shapiro(higher)\n",
+        "print('Statistics=%.3f, p=%.3f' % (stat, p))\n",
+        "# interpret\n",
+        "alpha = 0.05\n",
+        "if p > alpha:\n",
+        "\tprint('Sample looks Gaussian (fail to reject H0)')\n",
+        "else:\n",
+        "\tprint('Sample does not look Gaussian (reject H0)')"
+      ],
+      "execution_count": 170,
+      "outputs": [
+        {
+          "output_type": "stream",
+          "text": [
+            "Statistics=0.809, p=0.000\n",
+            "Sample does not look Gaussian (reject H0)\n"
+          ],
+          "name": "stdout"
+        }
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/"
+        },
+        "id": "nIfuvpRlpCYU",
+        "outputId": "cff78bac-6e0b-47de-e65f-98fd00bf4502"
+      },
+      "source": [
+        "print(np.mean(lower))\n",
+        "print(np.mean(higher))"
+      ],
+      "execution_count": 175,
+      "outputs": [
+        {
+          "output_type": "execute_result",
+          "data": {
+            "text/plain": [
+              "286.3841936957515"
+            ]
+          },
+          "metadata": {
+            "tags": []
+          },
+          "execution_count": 175
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "mNgnD4sIpHyn"
+      },
+      "source": [
+        "To test if there is a significant difference between volumes of messages (engagement) sent by participants who submitted low scores and those who submitted high scores, we can pwrform a Mann-Whitney U-test on the two lists."
+      ]
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "id": "fV9qJ9Z0p1Iq"
+      },
+      "source": [
+        "t, pvalue = stats.mannwhitneyu(lower,higher, alternative=None)"
+      ],
+      "execution_count": 171,
+      "outputs": []
+    },
+    {
+      "cell_type": "code",
+      "metadata": {
+        "colab": {
+          "base_uri": "https://localhost:8080/"
+        },
+        "id": "yNQPby3yp5JV",
+        "outputId": "961ceee1-5c6b-4251-ddf1-6d260d23502f"
+      },
+      "source": [
+        "print(t)\n",
+        "print(pvalue)"
+      ],
+      "execution_count": 172,
+      "outputs": [
+        {
+          "output_type": "stream",
+          "text": [
+            "2352817.0\n",
+            "0.15780557009578583\n"
+          ],
+          "name": "stdout"
+        }
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "mWUVTIGxq8zG"
+      },
+      "source": [
+        "## Results 3. Comparison of two groups, low bond score and high bond score - do their engaement levels differ?\n"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "D07kejG4847B"
+      },
+      "source": [
+        "The p-value of **0.158** is significantly above alpha of 0.05, we do not reject the above Null hypothesis: \n",
+        "\n",
+        "Based on this test, there is no significant evidence presented to suggest that the engagement levels of users change in different bond score groupings."
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "RCEW4Bob9tDS"
+      },
+      "source": [
+        "# Task 3 - Additional Analysis\n"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "igd-l5O595e6"
+      },
+      "source": [
+        "1. If further data were available (assuming data protection regulation allowed for the collection of the data) on the user profiles like geography, occupation, age, gender etc, we could potentially derive further insights from the data at a more granular level. We could see whether certain profile groups had a tendency to allocate higher or lower bond scores, or were more engaged than others. "
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "aj9qA7p6_D8E"
+      },
+      "source": [
+        "2. Further information on the quantity of the data in each message would be interesting to see. It is unclear from the data how long each message interaction is in terms of characters, or the type of language that was used. It would also be of interest to know why there wasn't a second bond score recorded for the majority of users."
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "1AaBGE7C_XjG"
+      },
+      "source": [
+        "3. Analysing the chat logs to look at the langauge used would be very interesting for sentiment analysis. This could assist in gauging the 'mood' of the user, in conjunction with the 'moodCategory' variable. We could potentially analyse the terms used in the log, and see if the use of certain terms correlates with user engagement or bond scores."
+      ]
+    }
+  ]
+}
\ No newline at end of file

	userid	mobilePlatform	tenureDay	waiBondSubscore
0	D2d+QvZOh6hbgFwBR9totchAC5k=	ios	5	2.75
1	UQq1EvExGUr3eEXbGObbiV+Mrtg=	android	6	3.75
2	qVyzInBHD+KDwYneOtRGUIjT17o=	ios	4	3.25
3	TAyM8LnnIjACZL1w3ckYmZZwe3o=	android	5	4.75
4	1vsxQ6OylVGzSrvt8PDMr9UXda4=	ios	5	4.00
	tenureDay	waiBondSubscore
count	5311.000000	5311.000000
mean	6.460930	3.836613
std	3.892763	0.768943
min	4.000000	1.000000
25%	4.000000	3.250000
50%	5.000000	4.000000
75%	6.000000	4.500000
max	16.000000	5.000000
tenureDay	4	5	6	14	15	16
userid
+/wAfc2I0c831C21wvh2Kcr4DZk=	4.25	NaN	NaN	4.0	NaN	NaN
+0NdvBGRsXuoa20PHou4K3FMlBA=	NaN	3.75	NaN	NaN	NaN	NaN
+0eFEPPuFJm9U5lXwlAKw/I+Clo=	NaN	NaN	3.75	NaN	NaN	NaN
+0pfU/ormz318pPBTZ6cWtrgHkI=	NaN	5.00	NaN	NaN	5.0	NaN
+11s2fkg+oFKje/WvOYnzxbYgtY=	4.50	NaN	NaN	NaN	NaN	NaN
	userid	userMessages	moodCategory
0	rLzw2UmRCEe46MtW5gES+bx5uRU=	45	neutral
1	V0EzPowhWQCxtw1Xtxv2l9RrJ0k=	70	NaN
2	bNQ0Y1NqoS4K4jwNTOQlR1dJHlQ=	83	NaN
3	6nO/an2GbB8cg/dDVm0qzc5kfag=	61	NaN
4	JM3fV1nBKwLHxhduyB8Are4RTAQ=	93	negative
tenureDay	0	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20	21	22	23	24	25	26	27	28
userid
+/wAfc2I0c831C21wvh2Kcr4DZk=	33.0	0.0	0.0	30.0	24.0	0.0	29.0	37.0	25.0	0.0	0.0	25.0	19.0	22.0	46.0	23.0	106.0	23.0	19.0	0.0	15.0	19.0	54.0	33.0	14.0	25.0	0.0	25.0	33.0
+0NdvBGRsXuoa20PHou4K3FMlBA=	54.0	30.0	22.0	7.0	7.0	58.0	5.0	25.0	0.0	0.0	22.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0
+0eFEPPuFJm9U5lXwlAKw/I+Clo=	51.0	150.0	126.0	0.0	0.0	0.0	63.0	0.0	86.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0
+0pfU/ormz318pPBTZ6cWtrgHkI=	103.0	74.0	11.0	37.0	0.0	64.0	67.0	19.0	51.0	0.0	50.0	22.0	57.0	47.0	9.0	43.0	15.0	18.0	23.0	25.0	40.0	2.0	26.0	0.0	25.0	0.0	9.0	0.0	56.0
+11s2fkg+oFKje/WvOYnzxbYgtY=	65.0	32.0	11.0	0.0	48.0	0.0	2.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	8.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0