# some paths ## directories results_dir='data/10xgenomics_PBMC_5k_motifs' read_dir="data/10xgenomics_PBMC_5k" seq_dir="data/genomes" ## input1 file_bed=$read_dir'/ctcf_motifs_10e-6.bed' file_bed_rmsk=$read_dir'/ctcf_motifs_10e-6_rmsk.bed' file_bam_open="$read_dir/atac_v1_pbmc_5k_possorted_filtered_30-84bp.bam" file_bai_open="$read_dir/atac_v1_pbmc_5k_possorted_filtered_30-84bp.bam.bai" file_bam_1nucl="$read_dir/atac_v1_pbmc_5k_possorted_filtered_133-266bp.bam" file_bai_1nucl="$read_dir/atac_v1_pbmc_5k_possorted_filtered_133-266bp.bam.bai" file_bam_2nucl="$read_dir/atac_v1_pbmc_5k_possorted_filtered_341-500bp.bam" file_bai_2nucl="$read_dir/atac_v1_pbmc_5k_possorted_filtered_341-500bp.bam.bai" file_bam_1nucl2="$read_dir/atac_v1_pbmc_5k_possorted_filtered_341-500bp_splitintwo.bam" file_bai_1nucl2="$read_dir/atac_v1_pbmc_5k_possorted_filtered_341-500bp_splitintwo.bam.bai" file_bam_nucl="$read_dir/atac_v1_pbmc_5k_possorted_filtered_nucleosomes.bam" file_bai_nucl="$read_dir/atac_v1_pbmc_5k_possorted_filtered_nucleosomes.bam.bai" file_hg19="$seq_dir/hg19.fasta" file_rmsk="$seq_dir/hg19_rmsk.bed" mkdir -p $results_dir # filter out motifs with >=30% repeated region inside bin/bedtools/bedtools subtract -A -f 0.3 -a $file_bed -b $file_rmsk > $file_bed_rmsk # matrix creation ## sequences and sequenced repeat masked file_mat_seq="$results_dir/ctcf_motifs_10e-6_sequences.mat" file_mat_seq_rmsk="$results_dir/ctcf_motifs_10e-6_sequences_rmsk.mat" bin/SequenceMatrixCreator --bed $file_bed --fasta $file_hg19 --from -400 --to 400 > $file_mat_seq bin/SequenceMatrixCreator --bed $file_bed_rmsk --fasta $file_hg19 --from -400 --to 400 > $file_mat_seq_rmsk ## open chromatin around CTCF motif for method in 'read' 'read_atac' 'fragment' do file_mat_open_1="$results_dir/ctcf_motifs_10e-6_open_bin1bp_$method.mat" bin/CorrelationMatrixCreator --bed $file_bed --bam $file_bam_open --bai $file_bai_open --from -400 --to 400 --binSize 1 --method $method > $file_mat_open_1 file_mat_open_2="$results_dir/ctcf_motifs_10e-6_open_bin2bp_$method.mat" bin/CorrelationMatrixCreator --bed $file_bed --bam $file_bam_open --bai $file_bai_open --from -400 --to 400 --binSize 2 --method $method > $file_mat_open_2 file_mat_open_10="$results_dir/ctcf_motifs_10e-6_open_bin10bp_$method.mat" bin/CorrelationMatrixCreator --bed $file_bed --bam $file_bam_open --bai $file_bai_open --from -1000 --to 1000 --binSize 10 --method $method > $file_mat_open_10 done ## mono around CTCF motif for method in 'read' 'fragment' 'fragment_center' do ### mono nucleosomes file_mat_1nucl_1="$results_dir/ctcf_motifs_10e-6_1nucl_bin1bp_$method.mat" bin/CorrelationMatrixCreator --bed $file_bed --bam $file_bam_1nucl --bai $file_bai_1nucl --from -400 --to 400 --binSize 1 --method $method > $file_mat_1nucl_1 file_mat_1nucl_2="$results_dir/ctcf_motifs_10e-6_1nucl_bin2bp_$method.mat" bin/CorrelationMatrixCreator --bed $file_bed --bam $file_bam_1nucl --bai $file_bai_1nucl --from -400 --to 400 --binSize 2 --method $method > $file_mat_1nucl_2 file_mat_1nucl_10="$results_dir/ctcf_motifs_10e-6_1nucl_bin10bp_$method.mat" bin/CorrelationMatrixCreator --bed $file_bed --bam $file_bam_1nucl --bai $file_bai_1nucl --from -1000 --to 1000 --binSize 10 --method $method > $file_mat_1nucl_10 done ## di nucleosomes around CTCF motif for method in 'read' 'fragment' 'fragment_center' do ### di nucleosomes file_mat_2nucl_1="$results_dir/ctcf_motifs_10e-6_2nucl_bin1bp_$method.mat" bin/CorrelationMatrixCreator --bed $file_bed --bam $file_bam_2nucl --bai $file_bai_2nucl --from -400 --to 400 --binSize 1 --method $method > $file_mat_2nucl_1 file_mat_2nucl_2="$results_dir/ctcf_motifs_10e-6_2nucl_bin2bp_$method.mat" bin/CorrelationMatrixCreator --bed $file_bed --bam $file_bam_2nucl --bai $file_bai_2nucl --from -400 --to 400 --binSize 2 --method $method > $file_mat_2nucl_2 file_mat_2nucl_10="$results_dir/ctcf_motifs_10e-6_2nucl_bin10bp_$method.mat" bin/CorrelationMatrixCreator --bed $file_bed --bam $file_bam_2nucl --bai $file_bai_2nucl --from -1000 --to 1000 --binSize 10 --method $method > $file_mat_2nucl_10 done ## mono nucleosomes from processed di-nucleosome data around CTCF motif for method in 'read' 'fragment' 'fragment_center' do ### mono nucleosomes file_mat_1nucl_1="$results_dir/ctcf_motifs_10e-6_2nuclsplitintwo_bin1bp_$method.mat" bin/CorrelationMatrixCreator --bed $file_bed --bam $file_bam_1nucl2 --bai $file_bai_1nucl2 --from -400 --to 400 --binSize 1 --method $method > $file_mat_1nucl_1 file_mat_1nucl_2="$results_dir/ctcf_motifs_10e-6_2nuclsplitintwo_bin2bp_$method.mat" bin/CorrelationMatrixCreator --bed $file_bed --bam $file_bam_1nucl2 --bai $file_bai_1nucl2 --from -400 --to 400 --binSize 2 --method $method > $file_mat_1nucl_2 file_mat_1nucl_10="$results_dir/ctcf_motifs_10e-6_2nuclsplitintwo_bin10bp_$method.mat" bin/CorrelationMatrixCreator --bed $file_bed --bam $file_bam_1nucl2 --bai $file_bai_1nucl2 --from -1000 --to 1000 --binSize 10 --method $method > $file_mat_1nucl_10 done ## all nucleosomes around CTCF motif for method in 'read' 'fragment' 'fragment_center' do ### mono nucleosomes file_mat_nucl_1="$results_dir/ctcf_motifs_10e-6_nucleosomes_bin1bp_$method.mat" bin/CorrelationMatrixCreator --bed $file_bed --bam $file_bam_nucl --bai $file_bai_nucl --from -400 --to 400 --binSize 1 --method $method > $file_mat_nucl_1 file_mat_nucl_2="$results_dir/ctcf_motifs_10e-6_nucleosomes_bin2bp_$method.mat" bin/CorrelationMatrixCreator --bed $file_bed --bam $file_bam_nucl --bai $file_bai_nucl --from -400 --to 400 --binSize 2 --method $method > $file_mat_nucl_2 file_mat_nucl_10="$results_dir/ctcf_motifs_10e-6_nucleosomes_bin10bp_$method.mat" bin/CorrelationMatrixCreator --bed $file_bed --bam $file_bam_nucl --bai $file_bai_nucl --from -1000 --to 1000 --binSize 10 --method $method > $file_mat_nucl_10 done