Basic Python Training at Arcesium - Day 3¶

Oct 25-31, 2018 Vikrant Patil

These notes are available online at http://notes.pipal.in/2018/arcesium-basic-oct/day3.html © Pipal Academy LLP

We will be using python 3 (>= 3.0) from anaconda for this training. You can download it from

https://www.anaconda.com/download/

looping ..continued¶

problem

write a function double which doubles every item from a list and returns new list
Write a function which squares every item from a list and returns it.
Write a function which finds product of all elements from a list.
make use of product to write a function to find factorial of given number

integers = list(range(10))

integers

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

for i in integers:
    print(i*i, end=",")

0,1,4,9,16,25,36,49,64,81,

def double(numbers):
    d = []
    for n in numbers:
        d.append(2*n)
    return d

d = double([23,324,1,4,65])
d

[46, 648, 2, 8, 130]

double(["hello", "some", "strings", "to", "have", "fun"])

['hellohello', 'somesome', 'stringsstrings', 'toto', 'havehave', 'funfun']

len(d)

5

d[4]

130

d[6]

---------------------------------------------------------------------------
IndexError                                Traceback (most recent call last)
<ipython-input-11-a1943ff16815> in <module>()
----> 1 d[6]

IndexError: list index out of range

empty = []

empty[0] = 0

---------------------------------------------------------------------------
IndexError                                Traceback (most recent call last)
<ipython-input-13-d37e925836a7> in <module>()
----> 1 empty[0] = 0

IndexError: list assignment index out of range

empty.append(0)

range(10)

range(0, 10)

list(range(10))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

list(range(1,10))

[1, 2, 3, 4, 5, 6, 7, 8, 9]

list(range(1, 20, 3))

[1, 4, 7, 10, 13, 16, 19]

def square(numbers):
    s = []
    for n in numbers:
        s.append(n*n)
    return s

def product(numbers):
    p = 1
    for n in numbers:
        p = p*n
    return p

product([3,1,2,3])

18

product([1,2,3,4])

24

product([1,2,3,4,5])

120

range(1,5)

range(1, 5)

def factorial(n):
    return product(range(1,n+1))

factorial(7)

5040

factorial(4)

24

def even(n):
    return n%2==0

def odd(n):
    return not even(n)


def evens(numbers):
    e = []
    for n in numbers:
        if even(n):
            e.append(n)
    return e

def odds(numbers):
    o = []
    for n in numbers:
        if odd(n):
            o.append(n)
    return o

[n*n for n in range(5)]

[0, 1, 4, 9, 16]

[2*d for d in range(7)]

[0, 2, 4, 6, 8, 10, 12]

def doublec(numbers):
    return [n*n for n in numbers]

doublec(range(5))

[0, 1, 4, 9, 16]

5%2

1

5%3

2

5/3

1.6666666666666667

5//3

1

def percent(perc, value):
    return perc/100.0*value

percent(10, 200)

20.0

def squareodds(numbers):
    return [n*n for n in numbers if odd(n)]

squareodds(range(20))

[1, 9, 25, 49, 81, 121, 169, 225, 289, 361]

odds(range(20))

[1, 3, 5, 7, 9, 11, 13, 15, 17, 19]

problem

write a function double which doubles every item from a list and returns new list
Write a function which finds 10% of every item from a list and returns it.
find sum of all multipliers if 7 or 11 less than 1000

if even(5) or 5==5:
    print("even!")

even!

"hel" in "hello" and "hello".endswith("lo")

True

def double(nums):
    return [2*x for x in nums]

def perc10(values):
    return [percent(10, v) for v in values]

sum([n for n in range(1000) if n%7==0 or n%11==0])

110110

tables = [[i*j for i in range(1,11)]  for j in range(1,6) ]

tables

[[1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
 [2, 4, 6, 8, 10, 12, 14, 16, 18, 20],
 [3, 6, 9, 12, 15, 18, 21, 24, 27, 30],
 [4, 8, 12, 16, 20, 24, 28, 32, 36, 40],
 [5, 10, 15, 20, 25, 30, 35, 40, 45, 50]]

tables[1]

[2, 4, 6, 8, 10, 12, 14, 16, 18, 20]

tables[0]

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

tables[3]

[4, 8, 12, 16, 20, 24, 28, 32, 36, 40]

tables[4]

[5, 10, 15, 20, 25, 30, 35, 40, 45, 50]

tables[0]  # gives me 0th row

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

tables[-1] # last row

[5, 10, 15, 20, 25, 30, 35, 40, 45, 50]

tables

[[1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
 [2, 4, 6, 8, 10, 12, 14, 16, 18, 20],
 [3, 6, 9, 12, 15, 18, 21, 24, 27, 30],
 [4, 8, 12, 16, 20, 24, 28, 32, 36, 40],
 [5, 10, 15, 20, 25, 30, 35, 40, 45, 50]]

row0 = tables[0]

row0[0]

1

row1 = tables[1]

row1[0]

2

def column(data, colnum):
    return [row[colnum] for row in data]

column(tables, 0)

[1, 2, 3, 4, 5]

column(tables, 1)

[2, 4, 6, 8, 10]

def column_(data, colnum):
    return [data[i][colnum] for i in range(len(data))]

def transpose(data):
    colcount = len(data[0])
    return [column(data, i) for i in range(colcount)]

transpose(tables)

[[1, 2, 3, 4, 5],
 [2, 4, 6, 8, 10],
 [3, 6, 9, 12, 15],
 [4, 8, 12, 16, 20],
 [5, 10, 15, 20, 25],
 [6, 12, 18, 24, 30],
 [7, 14, 21, 28, 35],
 [8, 16, 24, 32, 40],
 [9, 18, 27, 36, 45],
 [10, 20, 30, 40, 50]]

Files¶

%%file data.csv
1,2,3,4,5
11,12,13,14,15
21,22,23,24,25
31,32,33,34,35,
41,42,43,44,45

Writing data.csv

with open("data.csv") as f:
    for line in f:
        print(line, end="")

1,2,3,4,5
11,12,13,14,15
21,22,23,24,25
31,32,33,34,35,
41,42,43,44,45

f = open("data.csv")
for line in f:
    print(line, end="")
f.close()

1,2,3,4,5
11,12,13,14,15
21,22,23,24,25
31,32,33,34,35,
41,42,43,44,45

!cat data.csv

1,2,3,4,5
11,12,13,14,15
21,22,23,24,25
31,32,33,34,35,
41,42,43,44,45

!head data.csv

1,2,3,4,5
11,12,13,14,15
21,22,23,24,25
31,32,33,34,35,
41,42,43,44,45

f = open("data.csv")
print(f.read())

1,2,3,4,5
11,12,13,14,15
21,22,23,24,25
31,32,33,34,35,
41,42,43,44,45

f.close()

!head paytm.csv

f = open("data.csv")
print(f.readline(), end="")

1,2,3,4,5

f.readline()

'11,12,13,14,15\n'

f.readline()

'21,22,23,24,25\n'

f.readline()

'31,32,33,34,35,\n'

f.readline()

'41,42,43,44,45'

f.readline()

''

f.close()

f = open("data.csv")
f.readlines()

['1,2,3,4,5\n',
 '11,12,13,14,15\n',
 '21,22,23,24,25\n',
 '31,32,33,34,35,\n',
 '41,42,43,44,45']

f.read()

''

with open("numbers.txt", "w") as nums:
    nums.write("one\n")
    nums.write("two\n")
    nums.write("three\n")

!cat numbers.txt

one
two
three

%%file cat.py
import sys

def cat(file):
    with open(file) as f:
        print(f.read())
        
if __name__ == "__main__":
    cat(sys.argv[1])

Overwriting cat.py

!python cat.py numbers.txt

one
two
three

problem

Write a python module head.py which shows first n lines of file
```
python head.py 2 data.csv
1,2,3,4,5
11,12,13,14,15
```

%%file head.py
import sys

def head(filename, n):
    with open(filename) as f:
        for i in range(n):
            print(f.readline(), end="")
            

if __name__ == "__main__":
    head(sys.argv[1], int(sys.argv[2]))

Writing head.py

!python head.py day1.html 3

<!DOCTYPE html>
<html>
<head><meta charset="utf-8" />

[1,2,3,4,5] 1,2,3,4,5

Write data in csv format

def writecsv(data, filename):
    with open(filename, "w") as f:
        for row in data:
            strrow = [str(item) for item in row] # ["1","2","3","4","5"]
            line = ",".join(strrow) #  "1,2,3,4,5"
            f.write(line)
            f.write("\n")

writecsv(tables, "tables.txt")

!python cat.py tables.txt

1,2,3,4,5,6,7,8,9,10
2,4,6,8,10,12,14,16,18,20
3,6,9,12,15,18,21,24,27,30
4,8,12,16,20,24,28,32,36,40
5,10,15,20,25,30,35,40,45,50

for row in tables:
    print(str(row))

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
[2, 4, 6, 8, 10, 12, 14, 16, 18, 20]
[3, 6, 9, 12, 15, 18, 21, 24, 27, 30]
[4, 8, 12, 16, 20, 24, 28, 32, 36, 40]
[5, 10, 15, 20, 25, 30, 35, 40, 45, 50]

for row in tables:
    print([str(item) for item in row])

['1', '2', '3', '4', '5', '6', '7', '8', '9', '10']
['2', '4', '6', '8', '10', '12', '14', '16', '18', '20']
['3', '6', '9', '12', '15', '18', '21', '24', '27', '30']
['4', '8', '12', '16', '20', '24', '28', '32', '36', '40']
['5', '10', '15', '20', '25', '30', '35', '40', '45', '50']

def csvparse(filename):
    with open(filename) as f:
        data= []
        for line in f:
            data.append(line.strip().split(","))
        return data

csvparse("tables.txt")

[['1', '2', '3', '4', '5', '6', '7', '8', '9', '10'],
 ['2', '4', '6', '8', '10', '12', '14', '16', '18', '20'],
 ['3', '6', '9', '12', '15', '18', '21', '24', '27', '30'],
 ['4', '8', '12', '16', '20', '24', '28', '32', '36', '40'],
 ['5', '10', '15', '20', '25', '30', '35', '40', '45', '50']]

def csvparse(filename):
    with open(filename) as f:
        return [line.strip().split(",") for line in f]

csvparse("tables.txt")

[['1', '2', '3', '4', '5', '6', '7', '8', '9', '10'],
 ['2', '4', '6', '8', '10', '12', '14', '16', '18', '20'],
 ['3', '6', '9', '12', '15', '18', '21', '24', '27', '30'],
 ['4', '8', '12', '16', '20', '24', '28', '32', '36', '40'],
 ['5', '10', '15', '20', '25', '30', '35', '40', '45', '50']]

def csvparse(filename):
    def makeints(row):
        return [int(item) for item in row]
    
    with open(filename) as f:
        return [makeints(line.strip().split(",")) for line in f]

t = csvparse("tables.txt")

t

[[1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
 [2, 4, 6, 8, 10, 12, 14, 16, 18, 20],
 [3, 6, 9, 12, 15, 18, 21, 24, 27, 30],
 [4, 8, 12, 16, 20, 24, 28, 32, 36, 40],
 [5, 10, 15, 20, 25, 30, 35, 40, 45, 50]]

type(t[0][0])

int

%%file tables.csv
c1,c2,c3,c4,c5,c6,c7,c8,c9,c10
1,2,3,4,5,6,7,8,9,10
2,4,6,8,10,12,14,16,18,20
3,6,9,12,15  ,18,,24,27,30
4,8,12,16,20,24,28,32,36,40
5,10,15,20,25,30,35,40,,50

Overwriting tables.csv

csvparse("tables.csv")

---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-137-aa51ccf0d490> in <module>()
----> 1 csvparse("tables.csv")

<ipython-input-129-884d6b9d7966> in csvparse(filename)
      4 
      5     with open(filename) as f:
----> 6         return [makeints(line.strip().split(",")) for line in f]

<ipython-input-129-884d6b9d7966> in <listcomp>(.0)
      4 
      5     with open(filename) as f:
----> 6         return [makeints(line.strip().split(",")) for line in f]

<ipython-input-129-884d6b9d7966> in makeints(row)
      1 def csvparse(filename):
      2     def makeints(row):
----> 3         return [int(item) for item in row]
      4 
      5     with open(filename) as f:

<ipython-input-129-884d6b9d7966> in <listcomp>(.0)
      1 def csvparse(filename):
      2     def makeints(row):
----> 3         return [int(item) for item in row]
      4 
      5     with open(filename) as f:

ValueError: invalid literal for int() with base 10: 'c1'

def csvparse(filename):
    def myint(ns):
        try:
            return int(ns)
        except Exception as e:
            print(e)
            return 0
        
    def makeints(row):
        return [myint(item) for item in row]
    
    with open(filename) as f:
        headers = f.readline().strip().split(",")
        return [headers] +  [makeints(line.strip().split(",")) for line in f]

t = csvparse("tables.csv")

invalid literal for int() with base 10: ''
invalid literal for int() with base 10: ''

t[0]

['c1', 'c2', 'c3', 'c4', 'c5', 'c6', 'c7', 'c8', 'c9', 'c10']

t[1:]

[[1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
 [2, 4, 6, 8, 10, 12, 14, 16, 18, 20],
 [3, 6, 9, 12, 15, 18, 0, 24, 27, 30],
 [4, 8, 12, 16, 20, 24, 28, 32, 36, 40],
 [5, 10, 15, 20, 25, 30, 35, 40, 0, 50]]

sum(column(t[1:], 0))

15

import numpy as np

np.irr(t[1:][0])

nan

np.mean(t[1:][0])

5.5

np.mean(t[1:])

15.18

[np.mean(row) for row in t[1:]]

[5.5, 11.0, 14.4, 22.0, 23.0]

int(" ")

---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-149-75af607fcdd5> in <module>()
----> 1 int(" ")

ValueError: invalid literal for int() with base 10: ' '

int("-")

---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-150-bea2acd6979b> in <module>()
----> 1 int("-")

ValueError: invalid literal for int() with base 10: '-'

try:
    print(int("-"))
except Exception as e:
    print(e)
    print(0)

invalid literal for int() with base 10: '-'
0

url = " http://notes.pipal.in/2018/arcesium-basic-oct/paytm.csv"
import requests
def download(url, filename):
    response = requests.get(url)
    with open(filename, "w") as f:
        f.write(response.text)

download(url, "paytm1.csv")

!python head.py paytm1.csv 5

"Date","Activity","Source/Destination","Wallet Txn ID","Comment","Debit","Credit","Transaction Breakup"
"03/01/2018 12:13:20","Bonus Added","Paytm Order #CST_BUS_TICKETS-NEW-BONUS-12791","17290661578","","","39",""
"03/01/2018 12:10:04","Restored to Paytm Cash against failed order","Paytm BUS Order #4371207130","17290624804","","","403",""
"03/01/2018 12:09:48","Restored to Paytm Cash against failed order","Paytm BUS Order #4371207130","17290621887","","","403",""
"02/01/2018 19:13:00","Added to Paytm Cash","Paytm Order #4378724688","17283050777","","","3000",""

def paytm_parse(file):
    with open(file) as f:
        data = []
        for line in f:
            row = line.strip().split(",")
            row_ = [item.replace('"',"") for item in row]
            data.append(row_)
        return data

paytm = paytm_parse("paytm.csv")

paytm[0]

['Date',
 'Activity',
 'Source/Destination',
 'Wallet Txn ID',
 'Comment',
 'Debit',
 'Credit',
 'Transaction Breakup']

date= column(paytm[1:], 0)
activity = column(paytm[1:], 1)
src_dest = column(paytm[1:], 2)
txid = column(paytm[1:], 3)
comment = column(paytm[1:], 4)
debit = column(paytm[1:], 5)
credit = column(paytm[1:], 6)
breakup = column(paytm[1:], 7)

date[:5]

['03/01/2018 12:13:20',
 '03/01/2018 12:10:04',
 '03/01/2018 12:09:48',
 '02/01/2018 19:13:00',
 '01/01/2018 16:38:04']

debit[:5]

['', '', '', '', '99']

def myfloat(sf):
    try:
        return float(sf)
    except ValueError as v:
        return 0

debit_ = [myfloat(item) for item in debit]
credit_ = [myfloat(item) for item in credit]

debit_[:5]

[0, 0, 0, 0, 99.0]

sum(debit_)

48494.58

sum(credit_)

53120.3

activity[:20]

['Bonus Added',
 'Restored to Paytm Cash against failed order',
 'Restored to Paytm Cash against failed order',
 'Added to Paytm Cash',
 'Paid for Order',
 'Bonus Added',
 'Bonus Added',
 'Paid for Order',
 'Restored to Paytm Cash against failed order',
 'Paid for Order',
 'Paid for Order',
 'Paid for Order',
 'Paid for Order',
 'Paid for Order',
 'Added to Paytm Cash',
 'Paid for Order',
 'Paid for Order',
 'Paid for Order',
 'Paid for Order',
 'Bonus Added']

def checkifexists(pattern, col):
    for item in col:
        if pattern in item.lower():
            return True
    return False

checkifexists("uber", activity)

False

checkifexists("uber", comment)

False

checkifexists("uber", src_dest)

True

checkifexists("uber", txid)

False

"uber" in  "UBER Order #2df540e2a73".lower()

True

src_dest[:50]

['Paytm Order #CST_BUS_TICKETS-NEW-BONUS-12791',
 'Paytm BUS Order #4371207130',
 'Paytm BUS Order #4371207130',
 'Paytm Order #4378724688',
 'Paytm Order #4372700189',
 'Paytm Order #CASH-667743869',
 'Paytm Order #CASH-667743868',
 'Paytm BUS Order #4371207130',
 'Paytm Order #4365510241',
 'Paytm Order #4365510218',
 'Paytm Order #4365510241',
 'Paytm Order #4331644394',
 'UBER Order #fc814aee07043f07bdfa55c759e35a0',
 'UBER Order #2df540e2a73c3d55a4c035ded4c47a0',
 'Paytm Order #4292715590',
 'redbus Order #39662092',
 'UBER Order #6b3d39482a073d84bae3cebb139f9a0',
 'UBER Order #7aab90717ce23845b3921892a0253a0',
 'UBER Order #7a50e05172c03a6bbbe5b1ba73ad1a0',
 'Paytm Order #17068993541_cashback',
 'Order #SM_1CE10B1AA617BDA8',
 'UBER Order #6f607613d8fa3ee99dc2d2c5d9deda0',
 'UBER Order #a55e9f11a2413befa3a4ea081c032a0',
 'Paytm Order #17052777528_cashback',
 'Order #QR1513323783283',
 'Falcon 7 Order #QR4ADB6670F0DA3EAE',
 'UBER Order #1709f99f6523325eb9424259a076aa0',
 'UBER Order #4e56591df2233c2e9559fba80a555a0',
 'Paytm Order #17035256242_cashback',
 'Order #QR1513237003491',
 'UBER Order #30b17957509a3d92a33cb8f239aafa0',
 'UBER Order #b7a55bfef6b03bc69cf859e1a0414a0',
 'Paytm Order #17018952399_cashback',
 'Order #QR1513151296749',
 'UBER Order #76c8cdf4552e338eb672c5f6c3fb9a0',
 'UBER Order #8fb12fa743a03c0da560594902797a0',
 'UBER Order #ab266f4f66e13eb683d93aca096a6a0',
 'Paytm Order #4267654627',
 'UBER Order #22f0f0a58da63738b28a9e66ff4e3a0',
 'UBER Order #c02fdd41963e32db9a5f5dafdcaa4a0',
 'UBER Order #ee3c7194555a33628267a78316dada0',
 'Paytm Order #CASH-646367492',
 'Paytm BUS Order #4236033718',
 'Paytm Order #CASH-646364164',
 'Paytm Order #CASH-646364163',
 'Paytm BUS Order #4236002969',
 'Paytm Order #4194496739',
 'Paytm Order #4181287087',
 'Paytm Order #4181270403',
 'UBER Order #796cffcb45903114abae9a8f0f6b1a0']

def sumif(pattern, lookupdata, data):
    l = len(lookupdata)
    indices = [ i for i in range(l) if pattern in lookupdata[i].lower()]
    return sum([data[j] for j in indices])

sumif("x", ["x","x","X","y","y","z"], [1,1,1,2,3,4])

3

sumif("uber", src_dest, debit_)

15873.990000000005