Skip to content
Commits on Source (6)
# SeqSero 1.0
# SeqSero
Salmonella serotyping from genome sequencing data
......
......@@ -11,7 +11,8 @@ def main():
parser = argparse.ArgumentParser(usage='SeqSero.py -m <data_type> -i <input_data> [-b <BWA_algorithm>]\n\nDevelopper: Shaokang Zhang (zskzsk@uga.edu) and Xiangyu Deng (xdeng@uga.edu)\n\nContact email:seqsero@gmail.com')
parser.add_argument("-m", choices=['1','2','3', '4'],help="<int>: '1'(pair-end reads, interleaved),'2'(pair-end reads, seperated),'3'(single-end reads), '4'(assembly)")
parser.add_argument("-i", nargs="+", help="<string>: path/to/input_data")
parser.add_argument("-b",choices=['sam','mem'],default="sam",help="<string>: 'sam'(bwa samse/sampe), 'mem'(bwa mem), default=sam")
parser.add_argument("-b",choices=['sam','mem','nanopore'],default="sam",help="<string>: 'sam'(bwa samse/sampe), 'mem'(bwa mem), default=sam")
parser.add_argument("-d",help="<string>: output directory name, if not set, the output directory would be 'SeqSero_result_'+time stamp+one random number")
args=parser.parse_args()
dirpath = os.path.abspath(os.path.dirname(os.path.realpath(__file__)))
if len(sys.argv)==1:
......@@ -19,6 +20,8 @@ def main():
else:
request_id = time.strftime("%m_%d_%Y_%H_%M_%S", time.localtime())
request_id += str(random.randint(1, 10000000))
make_dir=args.d
if make_dir is None:
make_dir="SeqSero_result_"+request_id
os.system("mkdir "+make_dir)
os.system("cp -rf "+dirpath+"/database "+make_dir)
......
......@@ -46,7 +46,5 @@ GATAGCAAAGCTGTGACTGGTGTTTCTACTTTGGATACTACAGGTCTTACTGGCACGGATATTAAAACTGGCGTTGATGG
GATAGCAAAGCTGTGACTGGTGTTTCTACTTTGGATACTACAGGTCTTACTGGCACGGATATTAAAACTGGCGTTGATGGAGCTACCACTACGAGTGGCTCCATTAAAGATGGCAAAGTATACTATGATGGTGCTACTAAAAATTATTATGTTGAAGTAGACTTTTCTGATGCCGCTGATACTGCTAAAAATGGCTACTATAAAGTCAATGTTGCTGATGATGGCACTGTTACAATGGGGGCCTCGACTACTAAAGAACCTGCGAAACCTGCAGGTGTTGTTGAAGTAACGAAAACCCAAGAAGAGAAAGCAATTAAGGCGTCTGCTGAGGTGAAAGCTGCTTTGACTGCTGGTGGTGTCGATGCTGCTGATGTAGCTACG
>fliC_z41_Salmonella.enterica_Ottawa_AY353510
GATAGCAAAGCTGTTACTGCAACTCTTGATCTGGATGTGACAGATCTTGATACTAATGCTTTGAAAACCGCAACTGGGATCAGTGCAGGTAATCCTGCTGTTAAAGACGATAAAGTTTATTATGACAGCGCAAATAATAATTATTATGTAGAGGTTGAGGGCTTTACTGATAATACGAAAGATGGTTTCTACAAAGTTCAGGTTGGTGATGATGGCAAAGTGTCAATGGCCACAACTACCAATAAAGAAACAGCTACTCCTCCCGGAATTGTTGAAGTAAGTAAAACTCATGATGAGAAAGCTCTTAAAGCTTCTGCAGAGGTTAAAGCAGCTCTGATTGCTGGAGATATTGATACTGCTGATGCAGATGCTGCTGAAATG
>fliC_z44_Salmonella.enterica_Bulovka_AY353512_k,z
CAAGCTACAGTTGAAAACAGTGTCAAACTGGATACTAGTGCTCTTACTGCCGATGCAATTAAAGGTGGCGTAACAGGTGCGACAACAGCTGGTGCCCTCAAGGACGGTAAAGTTTACTCTAATGGTACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGGCTGACTCAGGTAAAAATGGTTTCCTTAAAGTTGATGTTAATACAACTACTGGAGCGGTTACAGTTCCTGCAGCAGCAAATACTGTAGCAGCAAAACCAGCAGGTGTGTCTGAAGTTACTGAAGTTCAGGGACTAAATACACCAAGTTCGGCTGTACAAGATCAGTTAACAGCTGCAGGTGTAAGTGCCGCTGATGCTGCTAAATCTGAAGTTGTGAAA
>fliC_z69_Salmonella.enterica_Pietersburg_AY353520
GATAGTAAAGCTGTAACAGTAGCTGCTGATTTAGATATTACCGCTCTTAATACCGATGCAGCTCTTAAAGCAGGAACGGGAGCTACAACAGGTACTCCATCAATAAAAGATGACAAAGTTTATTATGATAGTGCCAGCAAAAACTACTACGTTGAAGTTACCGGATTAACCGCCCCTGATGATGCTAAGAATGGCTTCTATAAAGTAAATGTTGCTGATGACGGTACAGTATCCATGGCCGCTAATACAGCTATAGAGGCGGGTAAACCAGCCGGTGCAGTAGAAGTAACAAAAACTCAAGAAGAAAAAAACCCATTACCATTATCAGCAGATCTCAAAACTTCTCTTAAATCTGGCGAGATTACAGATCCAGACATT
......@@ -6,8 +6,6 @@ AATACCACTGGTCTTAATGATGCAGCTCTTAAAACGGGTGTTGGTGGTGCAACAAACGGTACTGCTGCAATTAAGGATGG
AGTACCACTGGTCTTGATGATGCAGCTCTTAAAACGGGTGTTGGTGGTGCAACAAGCGGTACCGCTGCAATTAAGGATGGTAAAGTCTTCTTTGATGCAACTGATAATAAATATTTTATTGAAGTTGAAGGTTTAACCGCTGGCGACGCTACTAAAAATGGTGTTTATGAAGTTAGTGTTGCAGATGATGGCACTGTTACAATGCCGGCAACCACG
>fliC_l,z13_Salmonella.enterica_Kenya_AY353449
AGTACCACTGGTCTTGATGATGCAGCTCTTAAAACGGGTGTTGGTGGTGCAACAAGCGGTACCGCTGCAATTAAGGATGGTAAAGTCTTCTTTGATGCAACTGATAATAAATATTTCATTGAAGTTGAAGGTTTAACCGCTGGCGACGCTACTAAAAATGGTGTTTATGAAGTTAGTGTTGCAGATGATGGCACTGTTACAATGCCGGCAACTACG
>fliC_l,v,z13_Salmonella.enterica_Kimberley_AY353448
AATACCACTGGTCTTAATGATGCAGCTCTTAAAACGGGTGTTGGTGGTGCAACAAACGGTACTGCTGCAATTAAGGATGGTAAAGTCTTCTTCGATGCAACTGATAATAAATATTTTATTGAAGTAGAAGGTTTAACCGCTGGCGACGCTACTAAAAATGGTGTTTATGAAGTTAGTGTTGCAGATGATGGCACTGTTACAATGCCGGCAACCACG
>fliC_l,w_Salmonella.enterica_Glidji_AY353447
AATACCGCTGGTCTTAATGATACAGCTCTTAAAGCGGGTGTTGGTGGTGCAACAAACGGTACTGCTGCAATTAAGGATGGTAAAGTCTTCTTCGATGCAACTGATAATAAATATTTTATTGAAGTAGAAGGTTTAACCGCTGGCGACGCTACTAAAAATGGTGTTTATGAAGTTAGTGTTGCAGATGATGGCACTGTTACAATGCCGGCAACCACG
>fliC_l,z28_Salmonella.enterica_Javiana_AY353455
......
>fljB_1,5_Salmonella.enterica_IIIb.61:k:1,5_AY353278
ATGGCACAAGTAATCAACACTAACAGTCTGTCGTTGCTGACCCAGAATAACCTGAACAAATCCCAGTCCGCACTGGGTACCGCTATCGAGCGTCTGTCTTCCGGTCTGCGTATCAACAGCGCGAAAGACGATGCGGCAGGTCAGGCGATTGCTAACCGTTTCACTGCGAACATCAAAGGCCTGACTCAGGCTTCCCGTAACGCTAACGACGGTATTTCTATTGCGCAGACCACTGAAGGCGCGCTGAACGAAATCAACAACAACCTGCAGCGTGTGCGTGAACTGGCGGTTCAGTCTGCTAACAGCACCAACTCCCAGTCTGACCTCGACTCTATCCAGGCTGAAATCACCCAGCGTCTGAACGAAATCGACCGTGTATCCGGTCAGACTCAGTTCAACGGCGTGAAAGTTCTGGCGCAGGATAACACCCTGACCATCCAGGTTGGTGCCAATGACGGTGAAACCATCGATATCGATCTGAAGCAGATCAACTCTCAGACTCTGGGTCTGGATACGTTGAATGTGCAAAAAGCGTATGATGTGAAAGATACAGCAGCAACAACGAAAGCTTATGCTGATAATGGTACTACACTGGATGTATCAGGTCTTGATGATGCAGCGATTAAAGCGGCTACGGGTGGTACGACTGGTGCGCCTACTGTAACGGGCGGTGCGGTTAAATTTGACGCAGATAATAACAAGTACTTTGTTACTATTGGTGGCTTTACTGGTGGTGATGCTGCCAAAAATGGCGATTATGAAGTTAACGTTGCTACTGACGGTAAAGTAACACTTGCGACTGGTGCAACTAAAACCACAATGCCTGCAGGTGCTACAACCAAAACAGAAGTACAGGAATTAAAAGATACACCGGCAGTTGTATCAGCTGATGCTAAAAATGCTTTAATTGCTGCTGGCGTTGATACTACAGATGCAAATGCCGCGACATTGGTCAAAATGTCTTATACCGATAAAAATGGTAAGACAATTGAAGGCGGTTATGCGCTTAAAGCTGGCGATAAATATTACGCTGCTGATTACAATGAAACTACAGGAGCTATTAAAGCTAAAACCACAAGTTATACTGCTGCTGACGGTACTACTAAAACGGCGGCTAACCAACTTGGTGGCGCAGACGGTAAAACCGAAGTCGTTACTATCGACGGTAAAACCTATAATGCCAGCAAAGCTGCTGGTCATGATTTCAAAGCACAGCCAGATCTGGCTGAAGCAGCCGCTAAAACCACCGAAAACCCGCTGCAGAAAATTGATGCTGCGCTGGCACAGGTTGACACGTTACGTTCTGACCTGGGTGCGGTACAGAACCGTTTTAATTCCGCCATCACCAACCTGGGCAACACCGTAAACAACCTGACTTCTGCACGTAGCCGTATCGAAGATTCTGACTACGCGACTGAAGTCTCCAACATGTCTCGCGCGCAGATTCTGCAGCAGGCGGGGACTTCCGTTCTGGCGCAGGCTAACCAGGTCCCACAAAACGTGCTGTCTCTGTTACGTTAA
>fljB_1,5_Muenster_DTU-unknown_another_1,5
ATGGCACAAGTCATTAATACAAACAGCCTGTCGCTGTTGACCCAGAATAACCTGAACAAATCCCAGTCCGCTCTGGGCACCGCTATCGAGCGTCTGTCTTCCGGTCTGCGTATCAACAGCGCGAAAGACGATGCGGCAGGTCAGGCGATTGCTAACCGTTTTACCGCGAACATCAAAGGTCTGACTCAGGCTTCCCGTAACGCTAACGACGGTATCTCCATTGCGCAGACCACTGAAGGCGCGCTGAACGAAATCAACAACAACCTGCAGCGTGTGCGTGAACTGGCGGTTCAGTCTGCTAACAGCACCAACTCCCAGTCTGACCTCGACTCCATCCAGGCTGAAATCACCCAGCGCCTGAACGAAATCGACCGTGTATCCGGTCAGACTCAGTTCAACGGCGTGAAAGTCCTGGCGCAGGACAACACCCTGACCATCCAGGTTGGTGCCAACGACGGTGAAACTATCGATATCGATCTGAAGCAGATCAACTCTCAGACCCTGGGCCTGGATTCACTGAACGTGCAGAAAGCGTATGATGTGAAAGATACAGCAGTAACCACGAAAACTTATGCCAATAATGGTACTACACTGGATGTATCGGGTCTTGATGATGCAGCCATCAAAGCGGCCATAGGTGGTACGACTGGTACGCCTGCTGTAACGGGCGGTACAGTTAAATTTGACGCAGATAATAATAAGTATTTTGTTTCTATTGGTGGCTATACTGGTGCTGATGCATCCAAAAATGGCGATTATGAAGTTAACGTTGCTGCTGACGGTAAAGTTACACTTGCTACAGGTGCAACTAAAACCACAATACCGGCAGGTGCGACAACTAAAACAGAAGTACAGGAGTTAAAAGATACACCAACAGTTGTTTCAGCAGATGCGAAAAATGCCTTAATCGCTGGCGGCGTGGATGCTACCGATGCTAATGGCGCTGAGTTGGTCAAAATGTCTTATACCGATAAAAATGGTAAGACAATTGAAGGCGGTTATGCGCTTAAAGCTGGCGATAAGTATTACGCCGCAGATTACGATGAAGCGACAGGAGCAATTAAAGCTAAAACCACAAGTTATACCGCTGCTGACGGCGCTACCAAAACAGCGGCTAACCAACTGGGTGGCGTAGACGGTAAAACCGAAGTCGTTACTATCGACGGTAAAACCTACAATGCCAGCAAAGCCGCTGGTCATGATTTCAAAGCACAACCAGAGCTGGCTGAAGCAGCCGCTAAAACCACCGAAAACCCGCTGCAGAAAATTGATGCCGCGCTGGCGCAGGTGGATGCGCTGCGTTCTGACCTGGGTGCGGTACAGAACCGTTTTAACTCCGCTATCACCAACCTGGGCAATACCGTAAACAACCTGTCTGAAGCGCGTAGCCGTATCGAAGATTCCGACTATGCGACCGAAGTCTCCAACATGTCTCGCGCGCAGATTCTGCAGCAGGCCGGTACTTCCGTTCTGGCGCAGGCTAACCAGGTTCCGCAAAACGTCCTCTCTTTACTGCGTTAA
>fljB_1,7_Salmonella.enterica_Bredeney_AY353296
ATGGCACAAGTAATCAACACTAACAGTCTGTCGCTGCTGACCCAGAATAACCTGAACAAATCCCAGTCCGCACTGGGCACCGCTATCGAGCGTCTGTCTTCTGGTCTGCGTATCAACAGCGCGAAAGACGATGCGGCAGGTCAGGCGATTGCTAACCGTTTTACCGCGAACATCAAAGGTCTGACTCAGGCCTCCCGTAACGCTAACGACGGTATCTCCATTGCGCAGACCACTGAAGGCGCGCTGAACGAAATCAACAACAACCTGCAGCGTGTGCGTGAACTGGCGGTTCAGTCTGCTAACAGCACCAACTCCCAGTCTGACCTCGACTCCATCCAGGCTGAAATCACCCAGCGCCTGAACGAAATCGACCGTGTATCCGGCCAGACTCAGTTCAACGGCGTGAAAGTCCTGGCGCAGGACAACACCCTGACCATCCAGGTTGGTGCCAACGATGGTGAAACTATCGATATCGATCTGAAGCAGATCAACTCTCAGACCCTGGGTCTGGATTCACTGAACGTGCAGAAAGCGTATGATGTGAAAGATACAGCAGTAACAACGAAAGCTTATGCCAATAATGGTACTACACTGGATGTATCGGGTCTTGATGATGCAGCTATTAAAGCGGCTACGGGTGGTACGAATGGTGCACCTAGTGTAACAGGTAGTGCGGTTAAATTTGACGCAGATAATAACAAGTACTTTGTTACTATTGGTGGCTTTACTGGTGCTGATCTCGACAAAAATGGCGATTATGAAGTTAACGTTGCTACTGACGGTACAGTAACCCTTGCGGCTGGCGCAACTAAAACCACAATGCCTGCTGGTGCGACAACTAAAACAGAAGTACAGGAGTTAAAAGATACACCGGCAGTTGTTTCCGCAGATGCTAAAAATGCCTTAATTGCTGGCGGCGTTGACGCTACCGATGCTAATGGCGCTGAGTTGGTCAAAATGTCTTATACCGATAAAAATGGTAAGACAATTGAAGGCGGTTATGCGCTTAAAGCTGGCGATAAGTATTACGCCGCAGATTACGATGAAGCGACAGGAGCAATTAAAGCTAAAACCACAAGTTATACCGCTGCTGACGGCACTACCAAAACAGCGGCTAACCAACTGGGTGGCGTAGACGGTAAAACCGAAGTCGTTACTATCGACGGTAAAACCTATAATGCCAGCAAAGCCGCTGGTCATGATTTTAAAGCACAGCCAGAGCTGGCTGAAGCAGCCGCTAAAACCACCGAAAACCCGCTGCAGAAAATTGATGCCGCGCTGGCGCAGGTGGATGCGCTGCGTTCTGACCTGGGTGCGGTACAGAACCGTTTTAACTCCGCTATCACCAACCTGGGCAATACCGTAAACAACCTGTCTGAAGCGCGTAGCCGTATCGAAGATTCTGACTATGCGACCGAAGTTTCCAACATGTCTCGCGCGCAGATCCTGCAGCAGGCCGGTACTTCCGTTCTGGCACAGGCTAACCAGGTCCCGCAGAACGTGCTGTCTCTGTTACGTTAA
>fljB_1,2_Salmonella.enterica_Typhimurium_AY353264
......
......@@ -302,8 +302,6 @@ MAQVINTNSLSLLTQNNLNKSQSALGTAIERLSSGLRINSAKDDAAGQAIANRFTSNIKGLSQASRNANDGISIAQTTEG
MAQVINTNSLSLLTQNNLNKSQSALGTAIERLSSGLRINSAKDDAAGQAIANRFTANIKGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVKVLAQDNTLTIQVGANDGETIDIDLKQINSQTLGLDTLNVQKAYDVDSKAVTATLDLDVTDLDTNALKTATGISAGNPAVKDDKVYYDSANNNYYVEVEGFTDNTKDGFYKVQVGDDGKVSMATTTNKETATPPGIVEVSKTHDEKALKASAEVKAALIAGDIDTADADAAEMVKMSYTDKNGKTIDGGYAVKVGDNYYAATQKKDGSFSVNTTSYTDKDGNTKSALNQLGGADGKTEVVSIDGKTYNASKAAGHNFKAQPDLAEAATATTENPLQKIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR*
>z41__Salmonella.enterica__Maska__AY353511__k,z
MAQVINTNSLSLLTQNNLNKSQSALGTAIERLSSGLRINSAKDDAAGQAIANRFTANIKGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVKVLAQDNTLTIQVGANDGETIDIDLKQINSQTLGLDTLNVQKAYDVDSKAVTATLDLDVTDLDTNALKTATGISAGNPAVKDDKVYYDSANNNYYVEVEGFTDNTKDGFYKVQVGDDGKVSMATTTNKETATPPGIVEVSKTHDEKALKASAEVKAALMAGNIDTADADAAEMVKMSYTDKNGKTIDGGYAVKVGDNYYAATQKKDGSFSVNTTSYTDKDGNTKSALNQLGGVDGKTEVVTIDGKTYNASKAEGHNFKAQPELAEAATATTENPLQKIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR*
>z44__Salmonella.enterica__Bulovka__AY353512__k,z
MAQVINTNSLSLLTQNNLNKSQSALGTAIERLSSGLRINSAKDDAAGQAIANRFTANIKGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVKVLAQDNTLTIQVGANDGETIDIDLKQINSQTLGLDSLNVQKAYDVQATVENSVKLDTSALTADAIKGGVTGATTAGALKDGKVYSNGTDYYVEVSFADAADSGKNGFLKVDVNTTTGAVTVPAAANTVAAKPAGVSEVTEVQGLNTPSSAVQDQLTAAGVSAADAAKSEVVKMSYTDKNGKTIDGGFGIKVGDDIYAATKNKDGSISINATEYTDKDGNTKTALNQLGGVDGKTEVVTIDGKTYNASKAAGHDFKAQPELAEAAAKTTENPLQKIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR*
>z44__Salmonella.enterica__Quinhon__AY353513__k,z
MAQVINTNSLSLLTQNNLNKSQSALGTAIERLSSGLRINSAKDDAAGQAIANRFTANIKGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVKVLAQDNTLTIQVGANDGETIDIDLKQINSQTLGLDTLNVQKAYDVDSKAVTGVSTLDTTGLTGTDIKTGVDGATTTSDSIKDGKVYYDGAAKNYYVEVDFSDTAKNGYYKVNVADDGTVTMGASTTKEPAKPAGVVEVTKTQEEKAIKTSAEVKAALTAGGVDTADVATAEMVKMSYTDKNGKTIDGGYAVKVGDSYYAATQKKDGSFSVNTTSYTDKDGNTKSALNQLGGVDGKTEVVTIDGKTYNASKAAGHDFKAQPELAEAAAKTTENPLQKIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR*
>z47__Salmonella.enterica__IIIb.38:z47:z53__AY353514__other.z47
......
......@@ -89,6 +89,8 @@ ATGTCGTACAAAAGTAATAATTTCTATAGAAATATACTTTTATTGAGTTTTTTCTTTTCTGGCTTTAGCTTGTATACTGT
ATGATTGAAGGATATGTAGTATATAATAGTATTTTTCTTCTTGCCTTACTATTTGGCTTTATGAAGAATTACTGTCTTCGGAAATATTTTTTATTATGCTTATTCCTTGTCTTATGGGTTCCACTTGCCACTCGTTATGGCATTGGTCGTGACTATTTTAGCTATGTTGATATTTATAAAAATGTGTTAGTTACCAGAGATGGTATTGAAGTAGGTTTTTATTATCTAAATTATCTGTTGGCATATTTTGGTTTCCATTATCAATCTATATTTATATTGACATCTTTTATTACTGTCTATTTAAGTGTTAAAAGTTTTGATAGAGAATATACAATAGTATCAATTATATTATTTGGGGTTTTGGTTTACTTACAGGCGTTTAGTATTGTTAGGCAAATGCTTGCTGTAGCCTTATGTCTTTATAGCTGTTCGTTATGGAATAAAGGTGTTAAGGTTAAAGCAATTATTTTTCTTATGCTGGCACCTTTGTTTCATTATTCTGCTGTAATAATATTTATATTGGCAATAATTAGCAGATGTGTTAAAATCGATACGTTTAAATGTCTTGCTATGTTAGGGCTTAGCCTTATTTTTGTTTTTGTATTTAATGGGATCGATTTTATATTTTCAAATCCTATACTATTAAATAGTAAGTATGGATATTATGTAACATCAGCCTTTAACAGACCGACTGAAATAGGTTCAGGCATTGGAGTGGCAATAGCATTATTTCTTCCATTCTTGATTTTTATGAAAGCATCAAAAATATATAAACATAATAAAAATTATAATCTGATGCTATTAATAAACCTTGTATATGTTGTTTCATTTGTTTTATCTTTGAAAATATATATATTCGCCAGATTCACTGATGCGCTATCCTTTGTCCTGATATTACTTATCCCTGCTGCTCTTAAAATATCAAATACTAGAGGCCTATATTATAACTGTATGTTATCTGTTGTTATTCTTCACATTATGCTATTTGAAGTAAATCTTAAAGCAAATACAATTGCAGCTGGAGATATGTCTAATAGCGGGCTTGGAATCATGCCGTATAGCAACATAATAAACGCACATATGCTAAAATACTAG
>O_48_wzy
GTGATTATAAAGAAGAATAAATTTGTTTATTCGGTACTTAAAGTCTGGTTAATAGTCTCTTCATTGTATTATTTAAATGCTATTTTTTCCGGTGTTGATGCGTTAAAATATAATGAAGATTTGACGCAAAAGTTCATCAAATATGCAATATGTTTTATAATAAGTTTTTTTATTCTGTTCAATAGTAAACGAGTCAAATTTTTGGGGGCTTCGTTATTTTTCATAATCCTTTCGGTAGCTTCAGTAGTTATTGGTAATGTAGTAACGGTATATGCTACCGCGATGCTGATAATTGCTACCATGGTTGGTTTCAGCCAAATTATTCTTTATTTTTCTAATGATATGTCGAAGATTAATATGGTTTTATTATGGACTGGAATTATAATAGGCGCCATTTCTGTATTAGAATTAACAGTATTCTACGATTATATGGTCTCATATTGGGTTTCGACTGGTGGAGTCCGATCAATATCTTCTCTTCTTAATCCTACAAATAGCGGGGCTTATTCAGCGATTATAATTTTAATTGCTTTAGGGACTAATATAAGGAGTAAATTTAAGAGAACTTTATTTGCTTTAATGCCAATGATTACTTTAATCAGCAGCGGATCACGTACAGCATGGTTATCATTAGCATTAACATTATTATTGACGGTATTATTAAATGATAAGGCTAGTATACGATTACGGAAAAAAATATTAGCTATTGCAGGTATTGGAGCTATTTGTGGTGTGTTATATGTAGCATTTTATATGAGTAGTATCTCTGGTATTCAATCCCAACATCGAGGGCTTGATACATATACCGCATCAATTCGAGTTGAAAACTTTATAACATATATGAATTCAATTGATTTTGATATGTTATTACCTGATTTCCTTGATAAAAATATTAACCTTATATCAGATAATTTTTATCTAGTGTTATTAAATTATTTTGGAATTATTGGGGGTTATATTGTTTTTTTTATTTCAGTATTATTATTCTATTATAATATGCAAACAAAGGATTTTGATAAAAATATAGATGAAAGTATTTCTGTTTGGAGAGTGATATTCATCTATTTTCTGATATCTGGACTTTCAAACTCATTCATAAATTCTTTTCCTGTAAACCAACTATTTTTTATCTCATGCGGGTATTATGTGTATAAATATAACTTAATAAAGAAAAATGCTGGAAAGCAAATATGA
>O_48_unknown-from-cdc-new-genomes-sequence
CTGCAGCAAGCTCCTGAAGCTTATCCCCACCTTGAGCACCAAATTTCCAATTTTGTAAAATGTTACTCTTAAAGTTGCTACAATAATCACACTCTCCACTATTATCAAAAACTATGTTAGGATCAGATGTATCCATAATACAATGGCTACAAACTTTATAACTTTGATTTTCCATGTTCCCCCCTATTTAAAATGACTTTCATAACAATTTCATTAATTTCTTCTGTTTGTACTACATGTAATCCATGAAATAACACTAGTGTTCCCATTTCTTCATATTTATATGCAAGAGTTGATGGATATGAGATAACTACATCAACCTTAGGAAAAAAGTTATCGTCTATAATAAAATTGAATTTAAATTGCCTGACTTTTGAGGAAGCTCTTGCCTTAGGATGCTCTTTATAATAAATAGAACAATTTTCAATTTGTTGATTAATTAGAGAGCAAATTTTTAGCTGACCTTTCTCACACAATGAATGCCCAATAACTAACAATGTTAGCTGGTTCGATGATACTTGAGTAAGGGACAACATAGGTTTACTATATTCCACCTTTATAATTTCGGCCAAATTATAATCCAGTATGTTGTTTATAAACAATTGAAATTCAACTTCATCGAAAACAATTATTTTATCCAAATGCTTTAATTTATATGGTATCTTAAAAAGTAAATAGGCACTTGAATCAAGGGCTCTCAAAGATCCATGCTGGATAAGAGTATATTGAATTCCTTTTTCTCCTAACATTGAATCAATCAGGACCGCCCAACGATCATAATGTTCACTACTTATAACCTTTCCTTGTATTCTATTCATCACTAATGCGACAAGGAACCAAGATGGAGCTGTGTATATTTGCAGGCACCATTTGATAGTATGCTTCGATTTAAAAAAATAGAAAAACGCAAATATGCTTAGCAACATGCTTTTGAAAATATCTAAATACGAAGCCATCTCATAAATTGAAATAACTGTAGCATCACTTCTATCATTACACGATGATAATTTAATAACATTTAACTTTTTTCCATCCGAAATTTTACTATTATAATAATTAATTGCTTGCTCCGTACCTATTTCAGCGAATGAAAAATAGTAAAAGTCGCTTCTATCAATCAATTTATTTTTATCTGTAATTATTTTTTTGTATAATGCAACTATACATTTTAATATAGGATAAAATATAAACCCCCCTAATATGAAGAAAATCATAAGAGAGATATATCCCCCCCACAATTTATGCCTCCCATATGCCCATTTGCTGATCCGAGGTAATGGTGGTATTCTACCTTTCATGCCAGCGATCAACAATTTATCAATAGAGATTTCATTTTCCGTAGCTAACATATAGTAGCGTAAATATGTTTTATAAGAAATTCTCATCCGACATGCCCGTCATTAATAATATGTAGACGCTCTAATTAATAATCAATTATTGACTTTTTTAGAGATATTTGTAACTAGTTAACATGAAAAATTCATATAAAAATGCTAAGTCATCTTCTTATTTATATTTTTCTTGTTGACTAAATAAATTATCGATATAAAAATCATAACTGCTGACGGTGTAAAATACCCAGAACCTCTTAGCAAAAAATATATTATGCTCATTATTAAAACTATACTAAAAAACTTTATTTTTTTGTCATTGCATTTAAACCGCATGACACCTAAAAATAATGTATAAAGAAAAAAAATGCCCCCTAAGATACCAAATTCAACAATCAATTTAGAAATAAATAGTCCACCATCATATAAGTTAGAATCTGTATTCCCTCCCCTTAACCGCCCAATGATTGATACAAACTCTCCTCTTTCATTTGCATATCCCATATTTTGTAAACCATAACCAAGGCCATAGCTATCTCGCAACGCTAGATATGCTTGTTCATATCCAGATAATAAAGTTAATGTTGATGTATTTTTCGATTCTTGGCTTATATCTAATCGTTGCGAATAATAACTTAGTTTATCAATAGGTAAGATTCCAGCAATCAGCATACACGATGAAGATACGCAAATCATAATAATGAACATTGATTTAACTCTCATATAGTTTATAGCTATCGCTACAACAATACCTATAATCAATGTTAAATTCTGGACAATAAGAGCCGTAAATAAAAGAGGAATTCCATAGAGCAAATTTAATTTTTTCTGAGATATCTTATAGCAATAAAAGATTGTAACTATTAGTGCATAATGAGAGGGCTCAGTAAAAAACAACATTTCCTTTGAAGTGCTACTGCTTGATAATATAAAAAGAGATGACAATACCCCCAAAGCTATTAGTAATTTAAATAATTTTGATACTATTCTATCAAACTCCTGGTGAGTAATATTATCAATTGCCACCGATGAAAAATAACATGCGAGTAAAATATAAAATAAGAATAACAATGATGTAATATTCTTAGTGAAAGTAGTATTACCATTCTGAAATAGTAGACTACTTAACCCAAAATGAAACAATATTAGAAAAAAACTAATAACACTAAAAATTAAAAATGAATAACTTATAGTTAATTTATTAAAGCCAGAAATAACCACTAAAAATAATATTATAGTTGATATAAAGAAAATACCAATGAAATTCGAACCAACTTTATCATTTAACACCATTAACAGGCCTGGAACCAGCACCATTCCATAAAAAAATATTGAGGTCAGAACTTTATTAGTATTAAATTGCATTATAGTTAAACCTTATTATTCCTTTTAATTACAATAAAAAATTATATAGCATAAGTATTTTAATTTAAAACAATTAAACTTTTCGTACTTTTCGTAGTTCATGCTTTTAATAATAAACTATGTATCTCACCGAGAAATTCGCTATAACAAACGTAACACTATGCATTTTATATCTATATAAAATACAATAGGTAAGATATCATCTATTAGAATAAAATAAACTCTCGCCGGCAGATCGTCTAATTATAACCAAGAGTTTTATAAACATAGCCAGCTTTAAAAATAATAAAACTGAAAAAGAAATAATCATACCATAAGCAATGTAATTAATATTCGCGACCTTAAGTGCAATATAAAGAAAAGATGAAAACAGTAAAAAAGTTAAACACTGGCTCCAGACTATCATTTTATCTTTTCTTAGTGCATACAGACCCAGATGTGGTATAAGGCTTAAACAATATATAAACGTCGCCACAATTAGCAACTGAAATAGTGGAAGTAATTCCCAATATTCGATCTTTCCAATCCACTGAATGAGGATATAACCGGTAAAAAAACAACAAATACATAACAGAAGCGACACTGCTATTAATTTGAATGCGAATGACTTCATTCCAGCGATGAATCCAATGTAGTCCTTTCGATAACACAATTTTGCCAATTTTGGGAATGAAAAAGATATTAGGATCGTATCGAGGAAAGATTGTATAGCCGCCGTCATACTAATAAACAAAGTATATACACCAAGGATCTTTAGTCCAGCAATATGTTCAACGGCAAACCTATCAAATGTAAAAAAACCTCTGAGCGCCAAAGCGGCAATTAGCATTGGTGCGGAAAGGATAATTCCTCTCATTATCCAGCGCCAGCTAAATGGCGATGTAAACTTCCGTTTATTATTTTTTAGAATATAAAAAAAGCCCATTGCACTAGCACAGAATGTACCAAATAGCCATAATGTAAATACAATAAATAGATTTCTTGACGTAGGAAATAATAGCATAATGGCTATCACGAGCCAGCACCAAAGTCCTTGTCGTATAAACAACACAAGACTTGCGAAAGCTTGATTCTCGAGAGTTATTAATATTCTATTAATTTCTTGAGCTATATGTTCAAAAAAGAGAATAGCAAGAAACCAGTACTCACTTCCGTGGGGAAGAAAGGAATAATGTTGGATAACAATAAAAATGGGGATATAAAATATATATGATAATACATAAAAAAATGACTGATTTTTTAAAATAAAAAAAAGATCGTCACTTTTTGAGTTTATTATCTCTCTAGTACTATAAGTATAAAATTCAAATCCAATAGCAAAAATTGCGTAGCCCACAGCGGCGCTTATAAGACCATAGACTCCCAAATCTGATGATTGCAACAATTTTGCTAATAAAATTATAAACACAAACTTGCTTATCAAAGTAAAGCCACGTATACCTATACTTAAATAATATATAAAAAGAGATTTTTTCATTTGAATAAGCCAATAATGCTTAAAAATATCGTTAACATAATATTAAAAATAGGCCATATACTAATAGATAGCTTTTTAGAAGTTTACAGATCATAGAATGCTTTGAAGCCTAGATTAGCAGGATCATTTGATAAAAATGCTTTAATTATATCCACAATTCTATCTTTTACATTTTCCATAAAATATGGGTTTTTAGAGCTTTCTAGCTTAGAAATAAAAACTTTATCAGTCACACTCGAAATAGCTTCACGTATAGCATTTTTTTCACAAATAGTATCGACAACGCTTTCACCACGAATGCGCC
>O_4_wzx
GTGAAAGTTCAATTGTTAAAAATTCCGAGTCATTTAATTGTTGCAGGTTCATCATGGTTATCCAAAATAATAATTGCCGGGGTGCAGTTAGCAAGTATTTCATATCTTATTTCTATGCTAGGTGAAGAGAAATATGCAATCTTTAGTTTGTTAACTGGTTTATTAGTATGGTGTAGCGCTGTTGATTTTGGCATAGGTACAGGACTGCAAAATTATATATCAGAATGCAGAGCCAAAAACAAAAGTTATGATGCATATATTAAATCAGCATTACATCTAAGCTTTATAGCTATTATTTTTTTTATTGCTTTATTTTATATTTTTTCTGGGGTAATTTCCGCTAAATATCTTTCTTCTTTTCATGAGGTATTACAGGACAAAACCAGAATGCTCTTTTTTACCTCATGTCTGGTTTTCAGTTCTATTGGAATCGGAGCTATTGCTTATAAAATACTTTTTGCCGAATTGGTCGGGTGGAAAGCTAATCTATTAAACGCATTATCTTATATGATAGGTATGCTCGGCTTGCTATATATATACTATAGGGGGATCTCAGTTGACATAAAATTATCACTAATAGTCCTGTATCTTCCAGTGGGTATGATTTCATTGTGCTATATTGTATATAGATACATAAAGCTTTATCATGTTAAAACAACAAAATCTCATTATATAGCAATTTTACGTAGATCTTCAGGGTTTTTTCTTTTTACTTTATTATCGATAGTGGTGCTTCAAACAGATTATATGGTCATTTCTCAAAGGCTAACTCCTGCTGATATTGTTCAATATACAGTAACGATGAAAATTTTTGGTTTAGTCTTTTTTATTTATACTGCTATTTTGCAAGCATTATGGCCTATATGTGCTGAATTGAGAGTCAAACAGCAATGGAAAAAACTTAACAAAATGATAGGTGTCAATATTTTGCTTGGCTCACTATATGTTGTTGGATGTACAATATTTATTTATTTATTTAAAGAACAGATATTTTCAGTAATAGCCAAAGATATTAATTATCAAGTTTCTATTTTATCTTTTATGTTAATTGGCATATATTTCTGTATTCGCGTTTGGTGTGACACTTATGCAATGTTATTGCAAAGTATGAATTATTTAAAAATACTTTGGATATTAGTACCACTACAAGCAATAATTGGTGGAATAGCACAATGGTATTTTTCTAGTACGCTTGGAATCAGTGGAGTGCTGCTTGGCTTGATTATATCTTTTGCTTTAACTGTTTTTTGGGGGCTTCCACTAACTTACTTAATTAAGGCAAATAAGGGATAA
>O_50_wzy
......
......@@ -104,6 +104,8 @@ ATGATTGAAGGATATGTAGTATATAATAGTATTTTTCTTCTTGCCTTACTATTTGGCTTTATGAAGAATTACTGTCTTCG
GTGATTATAAAGAAGAATAAATTTGTTTATTCGGTACTTAAAGTCTGGTTAATAGTCTCTTCATTGTATTATTTAAATGCTATTTTTTCCGGTGTTGATGCGTTAAAATATAATGAAGATTTGACGCAAAAGTTCATCAAATATGCAATATGTTTTATAATAAGTTTTTTTATTCTGTTCAATAGTAAACGAGTCAAATTTTTGGGGGCTTCGTTATTTTTCATAATCCTTTCGGTAGCTTCAGTAGTTATTGGTAATGTAGTAACGGTATATGCTACCGCGATGCTGATAATTGCTACCATGGTTGGTTTCAGCCAAATTATTCTTTATTTTTCTAATGATATGTCGAAGATTAATATGGTTTTATTATGGACTGGAATTATAATAGGCGCCATTTCTGTATTAGAATTAACAGTATTCTACGATTATATGGTCTCATATTGGGTTTCGACTGGTGGAGTCCGATCAATATCTTCTCTTCTTAATCCTACAAATAGCGGGGCTTATTCAGCGATTATAATTTTAATTGCTTTAGGGACTAATATAAGGAGTAAATTTAAGAGAACTTTATTTGCTTTAATGCCAATGATTACTTTAATCAGCAGCGGATCACGTACAGCATGGTTATCATTAGCATTAACATTATTATTGACGGTATTATTAAATGATAAGGCTAGTATACGATTACGGAAAAAAATATTAGCTATTGCAGGTATTGGAGCTATTTGTGGTGTGTTATATGTAGCATTTTATATGAGTAGTATCTCTGGTATTCAATCCCAACATCGAGGGCTTGATACATATACCGCATCAATTCGAGTTGAAAACTTTATAACATATATGAATTCAATTGATTTTGATATGTTATTACCTGATTTCCTTGATAAAAATATTAACCTTATATCAGATAATTTTTATCTAGTGTTATTAAATTATTTTGGAATTATTGGGGGTTATATTGTTTTTTTTATTTCAGTATTATTATTCTATTATAATATGCAAACAAAGGATTTTGATAAAAATATAGATGAAAGTATTTCTGTTTGGAGAGTGATATTCATCTATTTTCTGATATCTGGACTTTCAAACTCATTCATAAATTCTTTTCCTGTAAACCAACTATTTTTTATCTCATGCGGGTATTATGTGTATAAATATAACTTAATAAAGAAAAATGCTGGAAAGCAAATATGA
>O-48_wzy-from-blake-2014K-0232
GTGATAATAAAAAAGTACAAAATTTTTTATTCAGCACTTAAAGTCTGGTTAATAGCCTCTTCATTGTATTATTTAAATGCTATTTTTTTAGGTGTTGATGCTTTAAAATATAATGAAGATTTGACGCAAAAGTTCATCAAATATGCAGTTTGTTTCATCATAAGCATCTATATTCTGATCAATAATAAACGAGTCAAATATCTGTGGGCTTCATTTTTTTTCATAATTCTTTCTGTAGCTTCAGTAGTTATTGATAGTGTTGTAACGGTATATGCAACCACGATGTTGATAATTGCTACCATGCTTGGTTTTAGCCAAATCATTGTTTATTTATCCAATGATATGTCGAGAATTAATATTGTTTTATTATGGACAGGTGTTATTGTAGGCACAATTTCTGTGTTAGAGCTGACTGTGTTCTACGATTATATGGTTTCATATTGGATTTCGACTGGCGGAATTCGATCAATATCTTCCCTTCTGAATCCTACAAATAGTGGAGCTTACTCAGCGATCATAATTTTAATTGCTTTAGCGACTAATATAAAGAATAAGTTTAGGAAAAGTTTATTTGTTTTAATGCCAATGATTACTTTAATCAGTAGTGGATCACGCACCGCATGGTTATCATTAGCATTAACATTGTTATTGACAGTATTGTTAAATGATAAGGCTAGCATACGATTACGGAAAAAAATATTAGCTGTTGCAGGTATTGGAGCTATTTGTGGTCTATTATATGTAGTATTTTATATGAATGCTACCTCTAGCATTCAATCTCAATATCGAGGACTTGATACATATACCGCATCAATTCGGATTGAAAACTTTATATCGTATATAAATTCAATTGATCTTTGCATGTTATTTCCTGATTTTTTTGACAAAAATATTATTCTTATATCAGATAATTTTTACCTTGTTTTATTAAATTATTTTGGGATTATTGGTTTTTATATTATTCTCTTAATGTCAATGTTGCTATTCTATTGTAATGTACAGATAAAGGATTTTAATGATATTATAAATGAAGATATTGCTATTTGGAGAGTAATCTTTATCTATTTTTTGATATCTGGTTTTTCAAACTCATTTATAAGTTCTTTTCCTGTAAACCAGCTATTCTTTATCTCATGCGGGTATTATGTGTATAAATATAAGTTAATAAAAGAAAATGTTGGAAAGTAAATATGA
>O-48_unknown-from-serveral-cdc-new-genomes
CTGCAGCAAGCTCCTGAAGCTTATCCCCACCTTGAGCACCAAATTTCCAATTTTGTAAAATGTTACTCTTAAAGTTGCTACAATAATCACACTCTCCACTATTATCAAAAACTATGTTAGGATCAGATGTATCCATAATACAATGGCTACAAACTTTATAACTTTGATTTTCCATGTTCCCCCCTATTTAAAATGACTTTCATAACAATTTCATTAATTTCTTCTGTTTGTACTACATGTAATCCATGAAATAACACTAGTGTTCCCATTTCTTCATATTTATATGCAAGAGTTGATGGATATGAGATAACTACATCAACCTTAGGAAAAAAGTTATCGTCTATAATAAAATTGAATTTAAATTGCCTGACTTTTGAGGAAGCTCTTGCCTTAGGATGCTCTTTATAATAAATAGAACAATTTTCAATTTGTTGATTAATTAGAGAGCAAATTTTTAGCTGACCTTTCTCACACAATGAATGCCCAATAACTAACAATGTTAGCTGGTTCGATGATACTTGAGTAAGGGACAACATAGGTTTACTATATTCCACCTTTATAATTTCGGCCAAATTATAATCCAGTATGTTGTTTATAAACAATTGAAATTCAACTTCATCGAAAACAATTATTTTATCCAAATGCTTTAATTTATATGGTATCTTAAAAAGTAAATAGGCACTTGAATCAAGGGCTCTCAAAGATCCATGCTGGATAAGAGTATATTGAATTCCTTTTTCTCCTAACATTGAATCAATCAGGACCGCCCAACGATCATAATGTTCACTACTTATAACCTTTCCTTGTATTCTATTCATCACTAATGCGACAAGGAACCAAGATGGAGCTGTGTATATTTGCAGGCACCATTTGATAGTATGCTTCGATTTAAAAAAATAGAAAAACGCAAATATGCTTAGCAACATGCTTTTGAAAATATCTAAATACGAAGCCATCTCATAAATTGAAATAACTGTAGCATCACTTCTATCATTACACGATGATAATTTAATAACATTTAACTTTTTTCCATCCGAAATTTTACTATTATAATAATTAATTGCTTGCTCCGTACCTATTTCAGCGAATGAAAAATAGTAAAAGTCGCTTCTATCAATCAATTTATTTTTATCTGTAATTATTTTTTTGTATAATGCAACTATACATTTTAATATAGGATAAAATATAAACCCCCCTAATATGAAGAAAATCATAAGAGAGATATATCCCCCCCACAATTTATGCCTCCCATATGCCCATTTGCTGATCCGAGGTAATGGTGGTATTCTACCTTTCATGCCAGCGATCAACAATTTATCAATAGAGATTTCATTTTCCGTAGCTAACATATAGTAGCGTAAATATGTTTTATAAGAAATTCTCATCCGACATGCCCGTCATTAATAATATGTAGACGCTCTAATTAATAATCAATTATTGACTTTTTTAGAGATATTTGTAACTAGTTAACATGAAAAATTCATATAAAAATGCTAAGTCATCTTCTTATTTATATTTTTCTTGTTGACTAAATAAATTATCGATATAAAAATCATAACTGCTGACGGTGTAAAATACCCAGAACCTCTTAGCAAAAAATATATTATGCTCATTATTAAAACTATACTAAAAAACTTTATTTTTTTGTCATTGCATTTAAACCGCATGACACCTAAAAATAATGTATAAAGAAAAAAAATGCCCCCTAAGATACCAAATTCAACAATCAATTTAGAAATAAATAGTCCACCATCATATAAGTTAGAATCTGTATTCCCTCCCCTTAACCGCCCAATGATTGATACAAACTCTCCTCTTTCATTTGCATATCCCATATTTTGTAAACCATAACCAAGGCCATAGCTATCTCGCAACGCTAGATATGCTTGTTCATATCCAGATAATAAAGTTAATGTTGATGTATTTTTCGATTCTTGGCTTATATCTAATCGTTGCGAATAATAACTTAGTTTATCAATAGGTAAGATTCCAGCAATCAGCATACACGATGAAGATACGCAAATCATAATAATGAACATTGATTTAACTCTCATATAGTTTATAGCTATCGCTACAACAATACCTATAATCAATGTTAAATTCTGGACAATAAGAGCCGTAAATAAAAGAGGAATTCCATAGAGCAAATTTAATTTTTTCTGAGATATCTTATAGCAATAAAAGATTGTAACTATTAGTGCATAATGAGAGGGCTCAGTAAAAAACAACATTTCCTTTGAAGTGCTACTGCTTGATAATATAAAAAGAGATGACAATACCCCCAAAGCTATTAGTAATTTAAATAATTTTGATACTATTCTATCAAACTCCTGGTGAGTAATATTATCAATTGCCACCGATGAAAAATAACATGCGAGTAAAATATAAAATAAGAATAACAATGATGTAATATTCTTAGTGAAAGTAGTATTACCATTCTGAAATAGTAGACTACTTAACCCAAAATGAAACAATATTAGAAAAAAACTAATAACACTAAAAATTAAAAATGAATAACTTATAGTTAATTTATTAAAGCCAGAAATAACCACTAAAAATAATATTATAGTTGATATAAAGAAAATACCAATGAAATTCGAACCAACTTTATCATTTAACACCATTAACAGGCCTGGAACCAGCACCATTCCATAAAAAAATATTGAGGTCAGAACTTTATTAGTATTAAATTGCATTATAGTTAAACCTTATTATTCCTTTTAATTACAATAAAAAATTATATAGCATAAGTATTTTAATTTAAAACAATTAAACTTTTCGTACTTTTCGTAGTTCATGCTTTTAATAATAAACTATGTATCTCACCGAGAAATTCGCTATAACAAACGTAACACTATGCATTTTATATCTATATAAAATACAATAGGTAAGATATCATCTATTAGAATAAAATAAACTCTCGCCGGCAGATCGTCTAATTATAACCAAGAGTTTTATAAACATAGCCAGCTTTAAAAATAATAAAACTGAAAAAGAAATAATCATACCATAAGCAATGTAATTAATATTCGCGACCTTAAGTGCAATATAAAGAAAAGATGAAAACAGTAAAAAAGTTAAACACTGGCTCCAGACTATCATTTTATCTTTTCTTAGTGCATACAGACCCAGATGTGGTATAAGGCTTAAACAATATATAAACGTCGCCACAATTAGCAACTGAAATAGTGGAAGTAATTCCCAATATTCGATCTTTCCAATCCACTGAATGAGGATATAACCGGTAAAAAAACAACAAATACATAACAGAAGCGACACTGCTATTAATTTGAATGCGAATGACTTCATTCCAGCGATGAATCCAATGTAGTCCTTTCGATAACACAATTTTGCCAATTTTGGGAATGAAAAAGATATTAGGATCGTATCGAGGAAAGATTGTATAGCCGCCGTCATACTAATAAACAAAGTATATACACCAAGGATCTTTAGTCCAGCAATATGTTCAACGGCAAACCTATCAAATGTAAAAAAACCTCTGAGCGCCAAAGCGGCAATTAGCATTGGTGCGGAAAGGATAATTCCTCTCATTATCCAGCGCCAGCTAAATGGCGATGTAAACTTCCGTTTATTATTTTTTAGAATATAAAAAAAGCCCATTGCACTAGCACAGAATGTACCAAATAGCCATAATGTAAATACAATAAATAGATTTCTTGACGTAGGAAATAATAGCATAATGGCTATCACGAGCCAGCACCAAAGTCCTTGTCGTATAAACAACACAAGACTTGCGAAAGCTTGATTCTCGAGAGTTATTAATATTCTATTAATTTCTTGAGCTATATGTTCAAAAAAGAGAATAGCAAGAAACCAGTACTCACTTCCGTGGGGAAGAAAGGAATAATGTTGGATAACAATAAAAATGGGGATATAAAATATATATGATAATACATAAAAAAATGACTGATTTTTTAAAATAAAAAAAAGATCGTCACTTTTTGAGTTTATTATCTCTCTAGTACTATAAGTATAAAATTCAAATCCAATAGCAAAAATTGCGTAGCCCACAGCGGCGCTTATAAGACCATAGACTCCCAAATCTGATGATTGCAACAATTTTGCTAATAAAATTATAAACACAAACTTGCTTATCAAAGTAAAGCCACGTATACCTATACTTAAATAATATATAAAAAGAGATTTTTTCATTTGAATAAGCCAATAATGCTTAAAAATATCGTTAACATAATATTAAAAATAGGCCATATACTAATAGATAGCTTTTTAGAAGTTTACAGATCATAGAATGCTTTGAAGCCTAGATTAGCAGGATCATTTGATAAAAATGCTTTAATTATATCCACAATTCTATCTTTTACATTTTCCATAAAATATGGGTTTTTAGAGCTTTCTAGCTTAGAAATAAAAACTTTATCAGTCACACTCGAAATAGCTTCACGTATAGCATTTTTTTCACAAATAGTATCGACAACGCTTTCACCACGAATGCGCC
>O-4_wzx
GTGAAAGTTCAATTGTTAAAAATTCCGAGTCATTTAATTGTTGCAGGTTCATCATGGTTATCCAAAATAATAATTGCCGGGGTGCAGTTAGCAAGTATTTCATATCTTATTTCTATGCTAGGTGAAGAGAAATATGCAATCTTTAGTTTGTTAACTGGTTTATTAGTATGGTGTAGCGCTGTTGATTTTGGCATAGGTACAGGACTGCAAAATTATATATCAGAATGCAGAGCCAAAAACAAAAGTTATGATGCATATATTAAATCAGCATTACATCTAAGCTTTATAGCTATTATTTTTTTTATTGCTTTATTTTATATTTTTTCTGGGGTAATTTCCGCTAAATATCTTTCTTCTTTTCATGAGGTATTACAGGACAAAACCAGAATGCTCTTTTTTACCTCATGTCTGGTTTTCAGTTCTATTGGAATCGGAGCTATTGCTTATAAAATACTTTTTGCCGAATTGGTCGGGTGGAAAGCTAATCTATTAAACGCATTATCTTATATGATAGGTATGCTCGGCTTGCTATATATATACTATAGGGGGATCTCAGTTGACATAAAATTATCACTAATAGTCCTGTATCTTCCAGTGGGTATGATTTCATTGTGCTATATTGTATATAGATACATAAAGCTTTATCATGTTAAAACAACAAAATCTCATTATATAGCAATTTTACGTAGATCTTCAGGGTTTTTTCTTTTTACTTTATTATCGATAGTGGTGCTTCAAACAGATTATATGGTCATTTCTCAAAGGCTAACTCCTGCTGATATTGTTCAATATACAGTAACGATGAAAATTTTTGGTTTAGTCTTTTTTATTTATACTGCTATTTTGCAAGCATTATGGCCTATATGTGCTGAATTGAGAGTCAAACAGCAATGGAAAAAACTTAACAAAATGATAGGTGTCAATATTTTGCTTGGCTCACTATATGTTGTTGGATGTACAATATTTATTTATTTATTTAAAGAACAGATATTTTCAGTAATAGCCAAAGATATTAATTATCAAGTTTCTATTTTATCTTTTATGTTAATTGGCATATATTTCTGTATTCGCGTTTGGTGTGACACTTATGCAATGTTATTGCAAAGTATGAATTATTTAAAAATACTTTGGATATTAGTACCACTACAAGCAATAATTGGTGGAATAGCACAATGGTATTTTTCTAGTACGCTTGGAATCAGTGGAGTGCTGCTTGGCTTGATTATATCTTTTGCTTTAACTGTTTTTTGGGGGCTTCCACTAACTTACTTAATTAAGGCAAATAAGGGATAA
>O-50_wzy
......
seqsero (1.0.1+dfsg-1) unstable; urgency=medium
* New upstream version
* Standards-Version: 4.2.1
-- Andreas Tille <tille@debian.org> Mon, 03 Sep 2018 19:33:13 +0200
seqsero (1.0-2) unstable; urgency=medium
* Standards-Version: 4.1.4
......
......@@ -8,7 +8,7 @@ Build-Depends: debhelper (>= 11~),
python,
bwa,
sra-toolkit
Standards-Version: 4.1.4
Standards-Version: 4.2.1
Vcs-Browser: https://salsa.debian.org/med-team/seqsero
Vcs-Git: https://salsa.debian.org/med-team/seqsero.git
Homepage: https://github.com/denglab/SeqSero
......
......@@ -13,4 +13,4 @@ Description: In Debian you do not call the Python script but
+ parser = argparse.ArgumentParser(usage='seqsero -m <data_type> -i <input_data> [-b <BWA_algorithm>]\n\nDeveloper: Shaokang Zhang (zskzsk@uga.edu) and Xiangyu Deng (xdeng@uga.edu)\n\nContact email:seqsero@gmail.com')
parser.add_argument("-m", choices=['1','2','3', '4'],help="<int>: '1'(pair-end reads, interleaved),'2'(pair-end reads, seperated),'3'(single-end reads), '4'(assembly)")
parser.add_argument("-i", nargs="+", help="<string>: path/to/input_data")
parser.add_argument("-b",choices=['sam','mem'],default="sam",help="<string>: 'sam'(bwa samse/sampe), 'mem'(bwa mem), default=sam")
parser.add_argument("-b",choices=['sam','mem','nanopore'],default="sam",help="<string>: 'sam'(bwa samse/sampe), 'mem'(bwa mem), default=sam")
......@@ -72,12 +72,16 @@ def BWA_analysis(sra_name,additional_file,database,mapping_mode,file_mode,z):
os.system("bwa aln database/"+database+" "+for_fq+" > "+for_sai)
os.system("bwa aln database/"+database+" "+rev_fq+" > "+rev_sai)
os.system("bwa sampe database/"+database+" "+for_sai+" "+ rev_sai+" "+for_fq+" "+rev_fq+" > "+sam)
elif mapping_mode=="nanopore":
os.system("bwa mem -x ont2d database/"+database+" "+for_fq+" "+rev_fq+" > "+sam)
else:
if mapping_mode=="mem":
os.system("bwa mem database/"+database+" "+for_fq+" > "+sam) #2014/12/23
elif mapping_mode=="sam":
os.system("bwa aln database/"+database+" "+for_fq+" > "+for_sai)
os.system("bwa samse database/"+database+" "+for_sai+" "+for_fq+" > "+sam)
elif mapping_mode=="nanopore":
os.system("bwa mem -x ont2d database/"+database+" "+for_fq+" > "+sam)
os.system("samtools view -F 4 -Sbh "+sam+" > "+bam)
os.system("samtools view -h -o "+sam+" "+bam)
file=open(sam,"r")
......@@ -376,12 +380,16 @@ def assembly(type,sra_name,for_fq,rev_fq,for_sai,rev_sai,sam,bam,database,databa
os.system("bwa aln database/"+database+" "+for_fq+" > "+for_sai)
os.system("bwa aln database/"+database+" "+rev_fq+" > "+rev_sai)
os.system("bwa sampe database/"+database+" "+for_sai+" "+ rev_sai+" "+for_fq+" "+rev_fq+" > "+sam)
elif mapping_mode=="nanopore":
os.system("bwa mem -x ont2d database/"+database+" "+for_fq+" "+rev_fq+" > "+sam)
else:
if mapping_mode=="mem":
os.system("bwa mem database/"+database+" "+for_fq+" > "+sam) #2014/12/23
elif mapping_mode=="sam":
os.system("bwa aln database/"+database+" "+for_fq+" > "+for_sai)
os.system("bwa samse database/"+database+" "+for_sai+" "+for_fq+" > "+sam)
elif mapping_mode=="nanopore":
os.system("bwa mem -x ont2d database/"+database+" "+for_fq+" > "+sam)
os.system("samtools view -F 4 -Sbh "+sam+" > "+bam)
os.system("samtools view -h -o "+sam+" "+bam)
......
......@@ -93,12 +93,16 @@ def BWA_O_analysis(sra_name,additional_file,database,mapping_mode,file_mode):
os.system("bwa sampe "+database+" "+for_sai+" "+ rev_sai+" "+for_fq+" "+rev_fq+" > "+sam)
elif mapping_mode=="mem":
os.system("bwa mem "+database+" "+for_fq+" "+rev_fq+" > "+sam) #2014/12/23
elif mapping_mode=="nanopore": ##
os.system("bwa mem -x ont2d "+database+" "+for_fq+" "+rev_fq+" > "+sam)##
else:
if mapping_mode=="mem":
os.system("bwa mem "+database+" "+for_fq+" > "+sam) #2014/12/23
elif mapping_mode=="sam":
os.system("bwa aln "+database+" "+for_fq+" > "+for_sai)
os.system("bwa samse "+database+" "+for_sai+" "+for_fq+" > "+sam)
elif mapping_mode=="nanopore":##
os.system("bwa mem -x ont2d "+database+" "+for_fq+" > "+sam)##
os.system("samtools view -F 4 -Sbh "+sam+" > "+bam)
os.system("samtools view -h -o "+sam+" "+bam)
......@@ -150,6 +154,7 @@ def BWA_O_analysis(sra_name,additional_file,database,mapping_mode,file_mode):
if "sdf" in x[0] and x[1]>3:#
qq=0#
print "$$$",x[0],"got a hit, reads:",x[1]#
final_O.remove(x)
if qq!=0:#
print "$$$No sdf exists"#
......@@ -194,6 +199,8 @@ def assembly(sra_name,potential_choice,for_fq,rev_fq,for_sai,rev_sai,sam,bam,map
elif mapping_mode=="sam":
os.system("bwa aln database/"+database+" "+for_fq+" > "+for_sai)
os.system("bwa samse database/"+database+" "+for_sai+" "+for_fq+" > "+sam)
elif mapping_mode=="nanopore":##
os.system("bwa mem -x ont2d database/"+database+" "+for_fq+" > "+sam)##
else:
if mapping_mode=="mem":
os.system("bwa mem database/"+database+" "+for_fq+" "+rev_fq+" > "+sam) #2014/12/23
......@@ -201,6 +208,8 @@ def assembly(sra_name,potential_choice,for_fq,rev_fq,for_sai,rev_sai,sam,bam,map
os.system("bwa aln database/"+database+" "+for_fq+" > "+for_sai)
os.system("bwa aln database/"+database+" "+rev_fq+" > "+rev_sai)
os.system("bwa sampe database/"+database+" "+for_sai+" "+ rev_sai+" "+for_fq+" "+rev_fq+" > "+sam)
elif mapping_mode=="nanopore":
os.system("bwa mem -x ont2d database/"+database+" "+for_fq+" "+rev_fq+" > "+sam)
os.system("samtools view -F 4 -Sbh "+sam+" > "+bam)
os.system("samtools view -h -o "+sam+" "+bam)
os.system("cat "+sam+"|awk '{if ($5>0) {print $10}}'>"+sam+"_seq.txt")
......
File mode changed from 100644 to 100755